ห่วงโซ่แห่งความคิด

การกระตุ้นความคิดแบบเป็นลำดับ – ทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับเรื่องนี้

การแก้ปัญหาเป็นความสามารถโดยธรรมชาติของมนุษย์ นับตั้งแต่ยุคดึกดำบรรพ์ เมื่อความท้าทายหลักในชีวิตของเราไม่ใช่การถูกสัตว์ร้ายกิน จนกระทั่งถึงยุคปัจจุบันที่ต้องรีบส่งของกลับบ้านอย่างรวดเร็ว เราได้ใช้ความคิดสร้างสรรค์ การใช้เหตุผลเชิงตรรกะ และสติปัญญาร่วมกันเพื่อคิดหาทางแก้ไขปัญหา

ขณะนี้ ในขณะที่เราได้เห็นการกำเนิดของสิ่งมีชีวิตที่มีความรู้สึกนึกคิดด้าน AI เราต้องเผชิญกับความท้าทายใหม่ๆ ที่เกี่ยวข้องกับความสามารถในการตัดสินใจของสิ่งมีชีวิตเหล่านี้ ในขณะที่ทศวรรษที่แล้วเป็นยุคแห่งการเฉลิมฉลองความเป็นไปได้และศักยภาพของโมเดลและแอปพลิเคชัน AI ทศวรรษนี้จะเป็นยุคแห่งการก้าวไปอีกขั้นหนึ่ง นั่นคือการตั้งคำถามถึงความชอบธรรมของการตัดสินใจที่ทำโดยโมเดลดังกล่าว และสรุปเหตุผลเบื้องหลังการตัดสินใจดังกล่าว

เนื่องจากปัญญาประดิษฐ์ที่สามารถอธิบายได้ (XAI) ได้รับความสนใจเพิ่มมากขึ้น นี่เป็นช่วงเวลาที่จะหารือเกี่ยวกับแนวคิดสำคัญในการพัฒนาโมเดล AI ที่เราเรียกว่า การกระตุ้นให้เกิดห่วงโซ่แห่งความคิดในบทความนี้ เราจะถอดรหัสและไขความลึกลับของคำเหล่านี้อย่างละเอียดว่าหมายถึงอะไรและมีคำศัพท์ง่าย ๆ อะไรบ้าง

การกระตุ้นแบบห่วงโซ่แห่งความคิดคืออะไร?

เมื่อจิตใจของมนุษย์เผชิญกับความท้าทายหรือปัญหาที่ซับซ้อน จิตใจจะพยายามแยกปัญหาเหล่านั้นออกเป็นขั้นตอนย่อยๆ ตามลำดับ จิตใจจะเชื่อมโยงและจำลองสถานการณ์เหตุและผลเพื่อวางแผนการแก้ปัญหาที่ดีที่สุดโดยใช้หลักตรรกะ

กระบวนการจำลองสิ่งนี้ในโมเดลหรือระบบ AI คือ การกระตุ้นห่วงโซ่แห่งความคิด.

ตามชื่อที่บ่งบอกไว้ โมเดล AI จะสร้างชุดความคิดเชิงตรรกะ (หรือขั้นตอน) ขึ้นมาเป็นชุดหรือเป็นห่วงโซ่ เพื่อแก้ปัญหาหรือข้อขัดแย้ง ลองนึกภาพว่านี่คือการให้คำแนะนำทีละขั้นตอนแก่บุคคลที่ขอเส้นทางไปยังจุดหมายปลายทาง

นี่เป็นเทคนิคหลักที่ใช้ในโมเดลการใช้เหตุผลของ OpenAI เนื่องจากโมเดลเหล่านี้ได้รับการออกแบบมาให้คิดก่อนที่จะสร้างการตอบสนองหรือคำตอบ โมเดลเหล่านี้จึงสามารถผ่านการทดสอบที่มนุษย์ทำขึ้นได้

[อ่านเพิ่มเติม: ทุกสิ่งที่คุณต้องรู้เกี่ยวกับ LLM]

ประโยชน์ของการกระตุ้นเตือนแบบลูกโซ่แห่งความคิด

สิ่งใดก็ตามที่ขับเคลื่อนด้วยตรรกะจะให้ข้อได้เปรียบที่สำคัญ ในทำนองเดียวกัน โมเดลที่ฝึกฝนโดยใช้การกระตุ้นแบบลำดับความคิดไม่เพียงแต่ให้ความแม่นยำและความเกี่ยวข้องเท่านั้น แต่ยังมีประโยชน์หลากหลาย เช่น:

ที่เพิ่มขึ้น การแก้ปัญหา ศักยภาพที่มีความสำคัญอย่างยิ่งในสาขาต่างๆ เช่น การดูแลสุขภาพและการเงิน ปริญญาโทสาขาบริหารธุรกิจ (LLM) ที่ใช้แนวคิดแบบลำดับขั้นตอนเพื่อกระตุ้นให้เข้าใจความท้าทายที่ชัดเจนและพื้นฐานได้ดีขึ้น และสร้างการตอบสนองหลังจากพิจารณาความน่าจะเป็นที่แตกต่างกันและสถานการณ์เลวร้ายที่สุด

การลดขนาด สมมติฐาน และผลลัพธ์ที่เกิดจากสมมติฐาน เพราะโมเดลใช้การคิดและการประมวลผลเชิงตรรกะและเป็นลำดับในการสรุปผล มากกว่าการสรุปผลโดยด่วน

เพิ่มขึ้น ความเก่งกาจ เนื่องจากไม่จำเป็นต้องฝึกโมเดลอย่างเข้มงวดในกรณีการใช้งานใหม่ เนื่องจากโมเดลเหล่านี้ดำเนินไปตามตรรกะ ไม่ได้อิงตามจุดประสงค์

ปลดข้อจำกัด การเชื่อมโยงกัน ในงานที่ต้องตอบหลายส่วน/หลายคำตอบ 

การทำงานของเทคนิคการกระตุ้นความคิดแบบห่วงโซ่ทางกายวิภาค

หากคุณคุ้นเคยกับสถาปัตยกรรมซอฟต์แวร์แบบโมโนลิธิก คุณจะรู้ว่าแอปพลิเคชันซอฟต์แวร์ทั้งหมดได้รับการพัฒนาเป็นหน่วยเดียวที่มีความสอดคล้องกัน การลดความซับซ้อนดังกล่าวเกิดขึ้นได้โดยใช้สถาปัตยกรรมไมโครเซอร์วิส ซึ่งเกี่ยวข้องกับการแบ่งซอฟต์แวร์ออกเป็นบริการอิสระ ส่งผลให้การพัฒนาผลิตภัณฑ์รวดเร็วขึ้นและมีฟังก์ชันการทำงานที่ราบรื่นด้วย

การกระตุ้น CoT ใน AI คล้ายกัน โดยที่ LLM จะได้รับคำแนะนำผ่านกระบวนการคิดเชิงตรรกะที่ต่อเนื่องกันเพื่อสร้างการตอบสนอง ซึ่งทำได้โดย:

  • คำสั่งที่ชัดเจน โดยที่แบบจำลองได้รับคำสั่งโดยตรงในการดำเนินการแก้ไขปัญหาตามลำดับผ่านคำสั่งที่ตรงไปตรงมา
  • การสอนโดยปริยายมีวิธีการที่ละเอียดอ่อนและละเอียดอ่อนกว่า ในกรณีนี้ แบบจำลองจะถูกใช้ตรรกะของงานที่คล้ายกัน และใช้ความสามารถในการอนุมานและความเข้าใจเพื่อจำลองตรรกะสำหรับปัญหาที่นำเสนอ
  • ตัวอย่างการสาธิต โดยที่โมเดลจะวางรูปแบบการใช้เหตุผลแบบทีละขั้นตอนและสร้างข้อมูลเชิงลึกเพิ่มเติมเพื่อแก้ไขปัญหา

3 กรณีตัวอย่างในโลกแห่งความเป็นจริงที่ใช้การแจ้งเตือน CoT

แบบจำลองการตัดสินใจทางการเงิน

แบบจำลองการตัดสินใจทางการเงิน

CoT แบบหลายโหมดในบอท

เตียงนอนหลายรูปแบบในหุ่นยนต์

บริการด้านการดูแลสุขภาพ

บริการด้านการรักษาพยาบาล

ในภาคส่วนที่มีความผันผวนสูงนี้ การกระตุ้น CoT สามารถใช้เพื่อทำความเข้าใจแนวโน้มทางการเงินที่อาจเกิดขึ้นของบริษัท ดำเนินการประเมินความเสี่ยงของผู้ขอสินเชื่อ และอื่นๆ อีกมากมายChatbots ที่ได้รับการพัฒนาและใช้งานสำหรับองค์กรต่างๆ ต้องมีฟังก์ชันเฉพาะทาง โดยต้องสามารถแสดงความสามารถในการทำความเข้าใจรูปแบบต่างๆ ของอินพุต การแจ้งเตือน CoT จะทำงานได้ดีที่สุดในกรณีดังกล่าว โดยที่ Bots จะต้องรวมข้อความและรูปภาพเข้าด้วยกันเพื่อสร้างคำตอบสำหรับคำถามตั้งแต่การวินิจฉัยผู้ป่วยจากข้อมูลการดูแลสุขภาพไปจนถึงการสร้างแผนการรักษาเฉพาะบุคคลสำหรับผู้ป่วย การกระตุ้น CoT สามารถเสริมเป้าหมายการดูแลสุขภาพสำหรับคลินิกและโรงพยาบาลได้

ตัวอย่าง

คำถามจากลูกค้า: ฉันสังเกตเห็นธุรกรรมในบัญชีของฉันที่ฉันไม่รู้จัก บัตรเดบิตของฉันสูญหาย และฉันต้องการตั้งค่าการแจ้งเตือนสำหรับธุรกรรมในบัญชีของฉัน คุณช่วยฉันเกี่ยวกับปัญหานี้ได้ไหม

ขั้นตอนที่ 1: ระบุและจัดหมวดหมู่ปัญหา

  • ธุรกรรมที่ไม่รู้จัก
  • บัตรเดบิตหาย
  • การตั้งค่าการแจ้งเตือนธุรกรรม

ขั้นตอนที่ 2: จัดการธุรกรรมที่ไม่รู้จัก

สอบถามรายละเอียด: คุณสามารถให้วันที่และจำนวนเงินของรายการได้หรือไม่?

  • สาขาที่ 1: หากมีการให้รายละเอียด:
    • ตรวจสอบธุรกรรม หากเป็นธุรกรรมฉ้อโกง ให้สอบถามว่าลูกค้าต้องการโต้แย้งหรือไม่
  • สาขาที่ 2: หากไม่มีรายละเอียด:
    • เสนอให้จัดทำรายการธุรกรรมล่าสุด

ขั้นตอนที่ 3: ระบุที่อยู่ของบัตรเดบิตที่สูญหาย

แช่แข็งการ์ด: แนะนำให้แช่แข็งทันที

  • สาขาที่ 1: หากลูกค้าตกลง:
    • หยุดบัตรและถามว่าต้องการบัตรใหม่หรือไม่ ยืนยันที่อยู่จัดส่ง
  • สาขาที่ 2: หากลูกค้าปฏิเสธ:
    • ให้คำแนะนำการตรวจสอบบัญชีเพื่อดูว่ามีธุรกรรมที่ไม่ได้รับอนุญาตหรือไม่

ขั้นตอนที่ 4: ตั้งค่าการแจ้งเตือนธุรกรรม

เลือกรูปแบบการแจ้งเตือน: SMS, อีเมล์ หรือทั้งสองอย่าง?

  • สาขาที่ 1: หากลูกค้าเลือก:
    • ตั้งค่าการแจ้งเตือนสำหรับธุรกรรมที่มีมูลค่าเกินกว่าที่กำหนด สอบถามจำนวนเงิน
  • สาขาที่ 2: หากไม่แน่ใจ:
    • แนะนำจำนวนเงินเริ่มต้น (เช่น 50 เหรียญ) และยืนยัน

ขั้นตอนที่ 5: จัดทำสรุปและขั้นตอนต่อไป

  • กำลังตรวจสอบธุรกรรมที่ไม่รู้จัก
  • อายัดบัตรเดบิตและอาจจะต้องออกบัตรใหม่
  • การตั้งค่าการแจ้งเตือนธุรกรรมตามที่ร้องขอ

เหตุผล:

กระบวนการนี้จะตอบสนองต่อข้อสงสัยของลูกค้าจำนวนมากอย่างมีประสิทธิภาพผ่านขั้นตอนที่ชัดเจนและสาขาการตัดสินใจ เพื่อให้แน่ใจว่าจะได้รับโซลูชันที่ครอบคลุม

ข้อจำกัดของการแจ้งเตือน CoT

ข้อจำกัดของการกระตุ้นเปล

ความคิดแบบต่อเนื่องนั้นมีประสิทธิผลจริง ๆ แต่ยังขึ้นอยู่กับกรณีการใช้งานและปัจจัยอื่น ๆ อีกหลายประการด้วย มีความท้าทายเฉพาะเจาะจงที่เกี่ยวข้องกับ CoT แจ้ง ในเอไอ ซึ่งป้องกันไม่ให้ผู้มีส่วนได้ส่วนเสียใช้ประโยชน์จากศักยภาพของมันได้อย่างเต็มที่ มาดูปัญหาคอขวดทั่วไปกัน:

งานง่ายๆ ที่ซับซ้อนเกินไป

แม้ว่าการกระตุ้นด้วย CoT จะได้ผลดีที่สุดสำหรับงานที่ซับซ้อน แต่ก็อาจทำให้การทำงานง่ายๆ ซับซ้อนขึ้นและสร้างการตอบสนองที่ผิดพลาดได้ สำหรับงานที่ไม่จำเป็นต้องมีการให้เหตุผล โมเดลคำตอบโดยตรงจะได้ผลดีที่สุด

เพิ่มภาระการคำนวณ

การประมวลผลของการแจ้งเตือน CoT ต้องใช้การประมวลผลจำนวนมาก และหากเทคนิคนี้ถูกนำไปใช้งานกับโมเดลขนาดเล็กที่มีความสามารถในการประมวลผลจำกัด ก็อาจทำให้โมเดลเหล่านั้นทำงานหนักเกินไป ผลที่ตามมาจากการนำไปใช้งานดังกล่าวอาจรวมถึงเวลาตอบสนองที่ช้าลง ประสิทธิภาพที่ต่ำ ความไม่สอดคล้องกัน และอื่นๆ

วิศวกรรมคุณภาพพร้อม AI

การกระตุ้น CoT ใน AI ทำงานภายใต้สมมติฐาน (หรือหลักการ) ว่าคำกระตุ้นเฉพาะเจาะจงนั้นได้รับการกำหนดอย่างชัดเจน มีโครงสร้าง และชัดเจน หากคำกระตุ้นขาดปัจจัยเหล่านี้ การกระตุ้น CoT จะสูญเสียความสามารถในการเข้าใจข้อกำหนด ส่งผลให้เกิดขั้นตอนต่อเนื่องที่ไม่เกี่ยวข้องและในที่สุดก็เกิดการตอบสนอง

[อ่านเพิ่มเติม: โมเดลภาษาขนาดเล็กคืออะไร ตัวอย่างในโลกแห่งความเป็นจริงและข้อมูลการฝึกอบรม]

ความสามารถในระดับลดลง

ผู้มีส่วนได้ส่วนเสียอาจพบว่าโมเดลของตนมีปัญหาหากต้องใช้การกระตุ้นความคิดแบบเป็นลำดับสำหรับชุดข้อมูลจำนวนมหาศาลหรือปัญหาที่ซับซ้อน สำหรับงานที่เกี่ยวข้องกับขั้นตอนการให้เหตุผลขนาดใหญ่ เทคนิคนี้อาจทำให้เวลาตอบสนองช้าลง ทำให้ไม่เหมาะสำหรับแอปพลิเคชันหรือกรณีการใช้งานที่ต้องการการสร้างการตอบสนองแบบเรียลไทม์

การกระตุ้น CoT เป็นเทคนิคที่ยอดเยี่ยมสำหรับการเพิ่มประสิทธิภาพการทำงานของ โมเดลภาษาขนาดใหญ่หากสามารถแก้ไขข้อบกพร่องดังกล่าวได้โดยใช้เทคนิคการปรับให้เหมาะสมหรือวิธีแก้ปัญหาเฉพาะหน้า ข้อบกพร่องเหล่านี้อาจให้ผลลัพธ์ที่น่าทึ่งได้ เมื่อเทคโนโลยีก้าวหน้าขึ้น จะเป็นเรื่องที่น่าสนใจที่จะได้เห็นว่าการกระตุ้นแบบ Chain-of-Thought พัฒนาไปอย่างไรและเรียบง่ายขึ้นแต่ก็กลายเป็นเรื่องเฉพาะกลุ่มมากขึ้นด้วยเช่นกัน

ชอบบทความนี้ไหม? ติดตาม Shaip บน LinkedIn เพื่อรับข้อมูลอัปเดตเพิ่มเติม

แบ่งปันสังคม