การแก้ปัญหาเป็นความสามารถโดยธรรมชาติของมนุษย์ นับตั้งแต่ยุคดึกดำบรรพ์ เมื่อความท้าทายหลักในชีวิตของเราไม่ใช่การถูกสัตว์ร้ายกิน จนกระทั่งถึงยุคปัจจุบันที่ต้องรีบส่งของกลับบ้านอย่างรวดเร็ว เราได้ใช้ความคิดสร้างสรรค์ การใช้เหตุผลเชิงตรรกะ และสติปัญญาร่วมกันเพื่อคิดหาทางแก้ไขปัญหา
ขณะนี้ ในขณะที่เราได้เห็นการกำเนิดของสิ่งมีชีวิตที่มีความรู้สึกนึกคิดด้าน AI เราต้องเผชิญกับความท้าทายใหม่ๆ ที่เกี่ยวข้องกับความสามารถในการตัดสินใจของสิ่งมีชีวิตเหล่านี้ ในขณะที่ทศวรรษที่แล้วเป็นยุคแห่งการเฉลิมฉลองความเป็นไปได้และศักยภาพของโมเดลและแอปพลิเคชัน AI ทศวรรษนี้จะเป็นยุคแห่งการก้าวไปอีกขั้นหนึ่ง นั่นคือการตั้งคำถามถึงความชอบธรรมของการตัดสินใจที่ทำโดยโมเดลดังกล่าว และสรุปเหตุผลเบื้องหลังการตัดสินใจดังกล่าว
เนื่องจากปัญญาประดิษฐ์ที่สามารถอธิบายได้ (XAI) ได้รับความสนใจเพิ่มมากขึ้น นี่เป็นช่วงเวลาที่จะหารือเกี่ยวกับแนวคิดสำคัญในการพัฒนาโมเดล AI ที่เราเรียกว่า การกระตุ้นให้เกิดห่วงโซ่แห่งความคิดในบทความนี้ เราจะถอดรหัสและไขความลึกลับของคำเหล่านี้อย่างละเอียดว่าหมายถึงอะไรและมีคำศัพท์ง่าย ๆ อะไรบ้าง
การกระตุ้นแบบห่วงโซ่แห่งความคิดคืออะไร?
เมื่อจิตใจของมนุษย์เผชิญกับความท้าทายหรือปัญหาที่ซับซ้อน จิตใจจะพยายามแยกปัญหาเหล่านั้นออกเป็นขั้นตอนย่อยๆ ตามลำดับ จิตใจจะเชื่อมโยงและจำลองสถานการณ์เหตุและผลเพื่อวางแผนการแก้ปัญหาที่ดีที่สุดโดยใช้หลักตรรกะ
กระบวนการจำลองสิ่งนี้ในโมเดลหรือระบบ AI คือ การกระตุ้นห่วงโซ่แห่งความคิด.
ตามชื่อที่บ่งบอกไว้ โมเดล AI จะสร้างชุดความคิดเชิงตรรกะ (หรือขั้นตอน) ขึ้นมาเป็นชุดหรือเป็นห่วงโซ่ เพื่อแก้ปัญหาหรือข้อขัดแย้ง ลองนึกภาพว่านี่คือการให้คำแนะนำทีละขั้นตอนแก่บุคคลที่ขอเส้นทางไปยังจุดหมายปลายทาง
นี่เป็นเทคนิคหลักที่ใช้ในโมเดลการใช้เหตุผลของ OpenAI เนื่องจากโมเดลเหล่านี้ได้รับการออกแบบมาให้คิดก่อนที่จะสร้างการตอบสนองหรือคำตอบ โมเดลเหล่านี้จึงสามารถผ่านการทดสอบที่มนุษย์ทำขึ้นได้
[อ่านเพิ่มเติม: ทุกสิ่งที่คุณต้องรู้เกี่ยวกับ LLM]
ประโยชน์ของการกระตุ้นเตือนแบบลูกโซ่แห่งความคิด
สิ่งใดก็ตามที่ขับเคลื่อนด้วยตรรกะจะให้ข้อได้เปรียบที่สำคัญ ในทำนองเดียวกัน โมเดลที่ฝึกฝนโดยใช้การกระตุ้นแบบลำดับความคิดไม่เพียงแต่ให้ความแม่นยำและความเกี่ยวข้องเท่านั้น แต่ยังมีประโยชน์หลากหลาย เช่น:
ที่เพิ่มขึ้น การแก้ปัญหา ศักยภาพที่มีความสำคัญอย่างยิ่งในสาขาต่างๆ เช่น การดูแลสุขภาพและการเงิน ปริญญาโทสาขาบริหารธุรกิจ (LLM) ที่ใช้แนวคิดแบบลำดับขั้นตอนเพื่อกระตุ้นให้เข้าใจความท้าทายที่ชัดเจนและพื้นฐานได้ดีขึ้น และสร้างการตอบสนองหลังจากพิจารณาความน่าจะเป็นที่แตกต่างกันและสถานการณ์เลวร้ายที่สุด
การลดขนาด สมมติฐาน และผลลัพธ์ที่เกิดจากสมมติฐาน เพราะโมเดลใช้การคิดและการประมวลผลเชิงตรรกะและเป็นลำดับในการสรุปผล มากกว่าการสรุปผลโดยด่วน
เพิ่มขึ้น ความเก่งกาจ เนื่องจากไม่จำเป็นต้องฝึกโมเดลอย่างเข้มงวดในกรณีการใช้งานใหม่ เนื่องจากโมเดลเหล่านี้ดำเนินไปตามตรรกะ ไม่ได้อิงตามจุดประสงค์
ปลดข้อจำกัด การเชื่อมโยงกัน ในงานที่ต้องตอบหลายส่วน/หลายคำตอบ
การทำงานของเทคนิคการกระตุ้นความคิดแบบห่วงโซ่ทางกายวิภาค
หากคุณคุ้นเคยกับสถาปัตยกรรมซอฟต์แวร์แบบโมโนลิธิก คุณจะรู้ว่าแอปพลิเคชันซอฟต์แวร์ทั้งหมดได้รับการพัฒนาเป็นหน่วยเดียวที่มีความสอดคล้องกัน การลดความซับซ้อนดังกล่าวเกิดขึ้นได้โดยใช้สถาปัตยกรรมไมโครเซอร์วิส ซึ่งเกี่ยวข้องกับการแบ่งซอฟต์แวร์ออกเป็นบริการอิสระ ส่งผลให้การพัฒนาผลิตภัณฑ์รวดเร็วขึ้นและมีฟังก์ชันการทำงานที่ราบรื่นด้วย
การกระตุ้น CoT ใน AI คล้ายกัน โดยที่ LLM จะได้รับคำแนะนำผ่านกระบวนการคิดเชิงตรรกะที่ต่อเนื่องกันเพื่อสร้างการตอบสนอง ซึ่งทำได้โดย:
- คำสั่งที่ชัดเจน โดยที่แบบจำลองได้รับคำสั่งโดยตรงในการดำเนินการแก้ไขปัญหาตามลำดับผ่านคำสั่งที่ตรงไปตรงมา
- การสอนโดยปริยายมีวิธีการที่ละเอียดอ่อนและละเอียดอ่อนกว่า ในกรณีนี้ แบบจำลองจะถูกใช้ตรรกะของงานที่คล้ายกัน และใช้ความสามารถในการอนุมานและความเข้าใจเพื่อจำลองตรรกะสำหรับปัญหาที่นำเสนอ
- ตัวอย่างการสาธิต โดยที่โมเดลจะวางรูปแบบการใช้เหตุผลแบบทีละขั้นตอนและสร้างข้อมูลเชิงลึกเพิ่มเติมเพื่อแก้ไขปัญหา
3 กรณีตัวอย่างในโลกแห่งความเป็นจริงที่ใช้การแจ้งเตือน CoT
แบบจำลองการตัดสินใจทางการเงิน
| CoT แบบหลายโหมดในบอท
| บริการด้านการดูแลสุขภาพ
|
|---|---|---|
| ในภาคส่วนที่มีความผันผวนสูงนี้ การกระตุ้น CoT สามารถใช้เพื่อทำความเข้าใจแนวโน้มทางการเงินที่อาจเกิดขึ้นของบริษัท ดำเนินการประเมินความเสี่ยงของผู้ขอสินเชื่อ และอื่นๆ อีกมากมาย | Chatbots ที่ได้รับการพัฒนาและใช้งานสำหรับองค์กรต่างๆ ต้องมีฟังก์ชันเฉพาะทาง โดยต้องสามารถแสดงความสามารถในการทำความเข้าใจรูปแบบต่างๆ ของอินพุต การแจ้งเตือน CoT จะทำงานได้ดีที่สุดในกรณีดังกล่าว โดยที่ Bots จะต้องรวมข้อความและรูปภาพเข้าด้วยกันเพื่อสร้างคำตอบสำหรับคำถาม | ตั้งแต่การวินิจฉัยผู้ป่วยจากข้อมูลการดูแลสุขภาพไปจนถึงการสร้างแผนการรักษาเฉพาะบุคคลสำหรับผู้ป่วย การกระตุ้น CoT สามารถเสริมเป้าหมายการดูแลสุขภาพสำหรับคลินิกและโรงพยาบาลได้ |
ตัวอย่าง
คำถามจากลูกค้า: ฉันสังเกตเห็นธุรกรรมในบัญชีของฉันที่ฉันไม่รู้จัก บัตรเดบิตของฉันสูญหาย และฉันต้องการตั้งค่าการแจ้งเตือนสำหรับธุรกรรมในบัญชีของฉัน คุณช่วยฉันเกี่ยวกับปัญหานี้ได้ไหม
ขั้นตอนที่ 1: ระบุและจัดหมวดหมู่ปัญหา
- ธุรกรรมที่ไม่รู้จัก
- บัตรเดบิตหาย
- การตั้งค่าการแจ้งเตือนธุรกรรม
ขั้นตอนที่ 2: จัดการธุรกรรมที่ไม่รู้จัก
สอบถามรายละเอียด: คุณสามารถให้วันที่และจำนวนเงินของรายการได้หรือไม่?
- สาขาที่ 1: หากมีการให้รายละเอียด:
- ตรวจสอบธุรกรรม หากเป็นธุรกรรมฉ้อโกง ให้สอบถามว่าลูกค้าต้องการโต้แย้งหรือไม่
- สาขาที่ 2: หากไม่มีรายละเอียด:
- เสนอให้จัดทำรายการธุรกรรมล่าสุด
ขั้นตอนที่ 3: ระบุที่อยู่ของบัตรเดบิตที่สูญหาย
แช่แข็งการ์ด: แนะนำให้แช่แข็งทันที
- สาขาที่ 1: หากลูกค้าตกลง:
- หยุดบัตรและถามว่าต้องการบัตรใหม่หรือไม่ ยืนยันที่อยู่จัดส่ง
- สาขาที่ 2: หากลูกค้าปฏิเสธ:
- ให้คำแนะนำการตรวจสอบบัญชีเพื่อดูว่ามีธุรกรรมที่ไม่ได้รับอนุญาตหรือไม่
ขั้นตอนที่ 4: ตั้งค่าการแจ้งเตือนธุรกรรม
เลือกรูปแบบการแจ้งเตือน: SMS, อีเมล์ หรือทั้งสองอย่าง?
- สาขาที่ 1: หากลูกค้าเลือก:
- ตั้งค่าการแจ้งเตือนสำหรับธุรกรรมที่มีมูลค่าเกินกว่าที่กำหนด สอบถามจำนวนเงิน
- สาขาที่ 2: หากไม่แน่ใจ:
- แนะนำจำนวนเงินเริ่มต้น (เช่น 50 เหรียญ) และยืนยัน
ขั้นตอนที่ 5: จัดทำสรุปและขั้นตอนต่อไป
- กำลังตรวจสอบธุรกรรมที่ไม่รู้จัก
- อายัดบัตรเดบิตและอาจจะต้องออกบัตรใหม่
- การตั้งค่าการแจ้งเตือนธุรกรรมตามที่ร้องขอ
เหตุผล:
กระบวนการนี้จะตอบสนองต่อข้อสงสัยของลูกค้าจำนวนมากอย่างมีประสิทธิภาพผ่านขั้นตอนที่ชัดเจนและสาขาการตัดสินใจ เพื่อให้แน่ใจว่าจะได้รับโซลูชันที่ครอบคลุม
ข้อจำกัดของการแจ้งเตือน CoT

ความคิดแบบต่อเนื่องนั้นมีประสิทธิผลจริง ๆ แต่ยังขึ้นอยู่กับกรณีการใช้งานและปัจจัยอื่น ๆ อีกหลายประการด้วย มีความท้าทายเฉพาะเจาะจงที่เกี่ยวข้องกับ CoT แจ้ง ในเอไอ ซึ่งป้องกันไม่ให้ผู้มีส่วนได้ส่วนเสียใช้ประโยชน์จากศักยภาพของมันได้อย่างเต็มที่ มาดูปัญหาคอขวดทั่วไปกัน:
งานง่ายๆ ที่ซับซ้อนเกินไป
แม้ว่าการกระตุ้นด้วย CoT จะได้ผลดีที่สุดสำหรับงานที่ซับซ้อน แต่ก็อาจทำให้การทำงานง่ายๆ ซับซ้อนขึ้นและสร้างการตอบสนองที่ผิดพลาดได้ สำหรับงานที่ไม่จำเป็นต้องมีการให้เหตุผล โมเดลคำตอบโดยตรงจะได้ผลดีที่สุด
เพิ่มภาระการคำนวณ
การประมวลผลของการแจ้งเตือน CoT ต้องใช้การประมวลผลจำนวนมาก และหากเทคนิคนี้ถูกนำไปใช้งานกับโมเดลขนาดเล็กที่มีความสามารถในการประมวลผลจำกัด ก็อาจทำให้โมเดลเหล่านั้นทำงานหนักเกินไป ผลที่ตามมาจากการนำไปใช้งานดังกล่าวอาจรวมถึงเวลาตอบสนองที่ช้าลง ประสิทธิภาพที่ต่ำ ความไม่สอดคล้องกัน และอื่นๆ
วิศวกรรมคุณภาพพร้อม AI
การกระตุ้น CoT ใน AI ทำงานภายใต้สมมติฐาน (หรือหลักการ) ว่าคำกระตุ้นเฉพาะเจาะจงนั้นได้รับการกำหนดอย่างชัดเจน มีโครงสร้าง และชัดเจน หากคำกระตุ้นขาดปัจจัยเหล่านี้ การกระตุ้น CoT จะสูญเสียความสามารถในการเข้าใจข้อกำหนด ส่งผลให้เกิดขั้นตอนต่อเนื่องที่ไม่เกี่ยวข้องและในที่สุดก็เกิดการตอบสนอง
[อ่านเพิ่มเติม: โมเดลภาษาขนาดเล็กคืออะไร ตัวอย่างในโลกแห่งความเป็นจริงและข้อมูลการฝึกอบรม]
ความสามารถในระดับลดลง
ผู้มีส่วนได้ส่วนเสียอาจพบว่าโมเดลของตนมีปัญหาหากต้องใช้การกระตุ้นความคิดแบบเป็นลำดับสำหรับชุดข้อมูลจำนวนมหาศาลหรือปัญหาที่ซับซ้อน สำหรับงานที่เกี่ยวข้องกับขั้นตอนการให้เหตุผลขนาดใหญ่ เทคนิคนี้อาจทำให้เวลาตอบสนองช้าลง ทำให้ไม่เหมาะสำหรับแอปพลิเคชันหรือกรณีการใช้งานที่ต้องการการสร้างการตอบสนองแบบเรียลไทม์
การกระตุ้น CoT เป็นเทคนิคที่ยอดเยี่ยมสำหรับการเพิ่มประสิทธิภาพการทำงานของ โมเดลภาษาขนาดใหญ่หากสามารถแก้ไขข้อบกพร่องดังกล่าวได้โดยใช้เทคนิคการปรับให้เหมาะสมหรือวิธีแก้ปัญหาเฉพาะหน้า ข้อบกพร่องเหล่านี้อาจให้ผลลัพธ์ที่น่าทึ่งได้ เมื่อเทคโนโลยีก้าวหน้าขึ้น จะเป็นเรื่องที่น่าสนใจที่จะได้เห็นว่าการกระตุ้นแบบ Chain-of-Thought พัฒนาไปอย่างไรและเรียบง่ายขึ้นแต่ก็กลายเป็นเรื่องเฉพาะกลุ่มมากขึ้นด้วยเช่นกัน





