กรกฎาคม 18, 2023

เบื้องหลัง: สำรวจการทำงานภายในของ ChatGPT – ตอนที่ 2

ยินดีต้อนรับกลับสู่ส่วนที่สองของการสนทนาที่น่าสนใจกับ ChatGPT ใน ส่วนเริ่มต้นของการสนทนาของเราเราได้กล่าวถึงบทบาทของการรวบรวมข้อมูล คำอธิบายประกอบ และความสำคัญของ Human-in-the-loop ในการฝึกอบรม Language Large Models ตอนนี้เราจะพูดถึงความท้าทาย ความลำเอียงที่ต้องเผชิญขณะฝึกโมเดล AI การประยุกต์ใช้ และโมเดล AI ขั้นสูงส่งผลกระทบต่อมนุษย์โดยทั่วไปอย่างไร

ใช่ กระบวนการอัตโนมัติของการเพิ่มคำอธิบายประกอบข้อมูลสามารถลดเวลา ค่าใช้จ่าย และข้อผิดพลาดของมนุษย์ที่อาจเกิดขึ้นซึ่งเกี่ยวข้องกับการเพิ่มความคิดเห็นด้วยตนเองได้ ซึ่งมักจะทำผ่านเทคนิคที่เรียกว่า "การติดฉลากอัตโนมัติ" หรือ "การเรียนรู้แบบกึ่งดูแล" ต่อไปนี้เป็นกลยุทธ์บางประการสำหรับคำอธิบายประกอบอัตโนมัติ:

ระบบตามกฎ: สิ่งเหล่านี้เกี่ยวข้องกับการสร้างกฎเฉพาะที่เครื่องปฏิบัติตามเพื่อใส่คำอธิบายประกอบข้อมูล ตัวอย่างเช่น กฎอาจกำหนดให้ข้อความใดๆ ที่ดูเหมือนที่อยู่อีเมล (เช่น มีสัญลักษณ์ "@") เป็น "อีเมล"
โมเดลการเรียนรู้ของเครื่อง: สามารถใช้โมเดลแมชชีนเลิร์นนิงที่ฝึกไว้ล่วงหน้าเพื่อใส่คำอธิบายประกอบข้อมูลใหม่ได้ ตัวอย่างเช่น แบบจำลองการจดจำเอนทิตีที่มีชื่อที่ได้รับการฝึกฝนไว้ล่วงหน้าสามารถใช้เพื่อระบุและติดป้ายกำกับเอนทิตีในข้อความได้
การเรียนรู้เชิงรุก: ในวิธีนี้ โมเดลแมชชีนเลิร์นนิงจะได้รับการฝึกอบรมเบื้องต้นด้วยชุดข้อมูลที่มีคำอธิบายประกอบด้วยตนเองชุดเล็กๆ จากนั้น แบบจำลองจะใส่คำอธิบายประกอบลงในข้อมูลที่มีความมั่นใจมากที่สุด และคำอธิบายประกอบเหล่านี้จะได้รับการตรวจสอบและแก้ไขโดยมนุษย์ แบบจำลองได้รับการฝึกอบรมใหม่ด้วยชุดข้อมูลที่ใหญ่กว่านี้ และกระบวนการนี้จะถูกทำซ้ำ
การกำกับดูแลที่อ่อนแอ: ที่นี่ มีการใช้คำอธิบายประกอบที่อ่อนแอหลายตัว (ซึ่งอาจเป็นระบบตามกฎ การจัดหาฝูงชน การวิเคราะห์พฤติกรรม ฯลฯ) เพื่อติดป้ายกำกับข้อมูล แม้ว่าคำอธิบายประกอบที่อ่อนแอแต่ละตัวจะไม่สมบูรณ์ แต่ป้ายกำกับที่รวมกันสามารถให้ค่าประมาณที่ดีสำหรับการฝึกโมเดลเริ่มต้น
โอนการเรียนรู้: วิธีการนี้ใช้ประโยชน์จากโมเดลที่ได้รับการฝึกอบรมในงานหนึ่งและนำไปใช้กับงานอื่นที่เกี่ยวข้อง ตัวอย่างเช่น โมเดลที่ได้รับการฝึกฝนให้จดจำวัตถุในภาพสามารถใช้เป็นจุดเริ่มต้นสำหรับโมเดลที่ออกแบบมาเพื่อจดจำวัตถุประเภทต่างๆ ได้

แม้ว่าคำอธิบายประกอบอัตโนมัติอาจเป็นเครื่องมือที่มีประสิทธิภาพ แต่สิ่งสำคัญคือต้องจำไว้ว่ามันไม่ได้สมบูรณ์แบบเสมอไป และคุณภาพอาจแตกต่างกันไปตามวิธีการที่ใช้และความซับซ้อนของงาน อาจมีข้อผิดพลาดเนื่องจากความลำเอียงในกฎเริ่มต้นหรือชุดการฝึก และงานที่ซับซ้อนมักต้องการการดูแลจากมนุษย์ ดังนั้น การรวมคำอธิบายประกอบแบบอัตโนมัติและแบบแมนนวล (การเรียนรู้แบบกึ่งดูแล) มักเป็นแนวทางที่ดีที่สุดสำหรับชุดข้อมูลขนาดใหญ่และซับซ้อน

การรวบรวมและใส่คำอธิบายประกอบข้อมูลสำหรับโครงการ AI และแมชชีนเลิร์นนิงอาจก่อให้เกิดความท้าทายหลายประการ ได้แก่:

ความหลากหลายของข้อมูลและความเป็นตัวแทน: การตรวจสอบให้แน่ใจว่าข้อมูลที่เก็บรวบรวมนั้นครอบคลุมสถานการณ์ที่หลากหลายและแสดงถึงสภาวะในโลกแห่งความเป็นจริงได้อย่างถูกต้องเป็นสิ่งที่ท้าทาย ตัวอย่างเช่น โมเดลการจดจำรูปภาพต้องการรูปภาพที่มีแสง การวางแนว และพื้นหลังที่หลากหลาย
ความเป็นส่วนตัวและจริยธรรมของข้อมูล: การเคารพสิทธิความเป็นส่วนตัวและการปฏิบัติตามหลักเกณฑ์ด้านจริยธรรมในขณะที่รวบรวมข้อมูลเป็นสิ่งสำคัญ การไม่เปิดเผยข้อมูลผู้ป่วยใน AI ด้านการดูแลสุขภาพช่วยให้มั่นใจได้ถึงความเป็นส่วนตัวโดยไม่กระทบต่อยูทิลิตี้สำหรับการฝึกอบรมแบบจำลอง
คุณภาพของข้อมูล: ข้อมูลคุณภาพสูงเป็นสิ่งจำเป็น ข้อมูลที่ส่งเสียงดัง ไม่เกี่ยวข้อง หรือไม่ถูกต้องอาจส่งผลเสียต่อประสิทธิภาพของโมเดล ข้อมูลโซเชียลมีเดียที่มีคำสแลง พิมพ์ผิด และการใช้ภาษาที่ไม่สอดคล้องกัน ก่อให้เกิดความท้าทายในการฝึกอบรมการวิเคราะห์ความรู้สึก
คำอธิบายประกอบคุณภาพและความสอดคล้อง: การตรวจสอบคำอธิบายประกอบที่ถูกต้องและสอดคล้องกันนั้นซับซ้อน ในการจัดประเภทภาพ ตัวเขียนที่แตกต่างกันซึ่งติดฉลากวัตถุเดียวกันต่างกันอาจทำให้โมเดลสับสนระหว่างการฝึกได้
เวลาและค่าใช้จ่าย: คำอธิบายประกอบด้วยตนเองใช้เวลานานและมีราคาแพง โดยเฉพาะอย่างยิ่งสำหรับชุดข้อมูลขนาดใหญ่ สำหรับการประมวลผลภาษาธรรมชาติ ผู้ทำคำอธิบายประกอบต้องใช้เวลาและความเชี่ยวชาญทางภาษาอย่างมากในการทำความเข้าใจบริบทของข้อความ
scalability: การปรับขนาดกระบวนการคำอธิบายประกอบในขณะที่รักษาคุณภาพไว้เป็นสิ่งที่ท้าทาย แบบจำลองภาษามักต้องการตัวอย่างหลายพันล้านตัวอย่าง ซึ่งจำเป็นต้องมีการประสานงานระหว่างทีมผู้ทำหมายเหตุประกอบจำนวนมาก และรับประกันความสอดคล้องกันในหมายเหตุประกอบ
ความคลุมเครือของฉลาก: ป้ายกำกับที่ถูกต้องอาจเป็นเรื่องส่วนตัวและเปิดกว้างสำหรับการตีความ ผู้ทำหมายเหตุประกอบอาจมีความคิดเห็นต่างกันในงานวิเคราะห์ความรู้สึก ซึ่งนำไปสู่การกำหนดป้ายกำกับที่แตกต่างกันสำหรับข้อความเดียวกัน
ข้อมูลที่ละเอียดอ่อน: การจัดการข้อมูลที่ละเอียดอ่อน เช่น บันทึกทางการแพทย์หรือการเงิน จำเป็นต้องมีความระมัดระวังเพิ่มเติม ผู้ทำคำอธิบายประกอบอาจต้องการการฝึกอบรมหรือการรับรองพิเศษเพื่อจัดการข้อมูลนี้อย่างเหมาะสมและรับประกันการป้องกัน

การจัดการกับความท้าทายเหล่านี้มักจะต้องใช้การผสมผสานระหว่างการวางแผนโครงการที่ดี แนวทางที่ชัดเจนสำหรับผู้รวบรวมข้อมูลและตัวเพิ่มความคิดเห็น การใช้เครื่องมืออัตโนมัติหากเป็นไปได้ และระบบที่มีประสิทธิภาพสำหรับการควบคุมคุณภาพ

ความลำเอียงในข้อมูลการฝึกอบรมเป็นปัญหาสำคัญในการเรียนรู้ของเครื่อง เนื่องจากโมเดลเรียนรู้จากข้อมูลที่ได้รับการฝึกอบรม หากข้อมูลการฝึกมีความเอนเอียง การคาดคะเนของแบบจำลองก็สามารถเอนเอียงได้เช่นกัน ต่อไปนี้เป็นวิธีแก้ไขอคติในระหว่างกระบวนการปรับแต่ง:

ปรับสมดุลชุดข้อมูล: ปรับชุดข้อมูลให้มีการแสดงคลาสต่างๆ อย่างเท่าเทียมกัน
ใช้อัลกอริทึมลดอคติ: ใช้เทคนิคที่ออกแบบมาเพื่อลดอคติในการทำนายของแบบจำลอง
ใช้ความเป็นส่วนตัวที่แตกต่าง: เพิ่มสัญญาณรบกวนให้กับข้อมูลเพื่อปกป้องแอตทริบิวต์ที่ละเอียดอ่อน
ดำเนินการปรับจูนโมเดล Bias-Aware: ปรับโมเดลโดยคำนึงถึงการลดอคติ
ใช้การทบทวนและแนวทางโดยมนุษย์: ผู้ตรวจสอบปฏิบัติตามแนวทางที่ไม่ให้เข้าข้างกลุ่มใดกลุ่มหนึ่งในระหว่างการปรับจูน
สร้างลูปคำติชมอย่างต่อเนื่อง: การมีปฏิสัมพันธ์กับผู้ตรวจสอบเป็นประจำทำให้สามารถเรียนรู้และแก้ไขอคติได้อย่างต่อเนื่อง

โปรดจำไว้ว่า การกำจัดอคติให้หมดไปนั้นเป็นสิ่งที่ท้าทาย แต่ขั้นตอนเหล่านี้สามารถช่วยลดอคติได้

โมเดลภาษาขนาดใหญ่มีการใช้งานจริงที่หลากหลายในอุตสาหกรรมต่างๆ:

การสร้างเนื้อหา: พวกเขาสามารถช่วยในการสร้างเนื้อหา เช่น บทความ รายงาน และอีเมล
การบริการของลูกค้า: สามารถใช้ในแชทบอทและผู้ช่วยเสมือนเพื่อให้การสนับสนุนลูกค้าโดยอัตโนมัติ
การแปลภาษา: พวกเขาสามารถช่วยในการแปลข้อความระหว่างภาษาต่างๆ
กวดวิชา: สามารถให้คำอธิบายในเรื่องต่าง ๆ ช่วยในการศึกษา
การเขียนโค้ด: พวกเขาสามารถช่วยในการเขียนโค้ด ช่วยในการพัฒนาซอฟต์แวร์
การตลาดและการโฆษณา: พวกเขาสามารถสร้างเนื้อหาที่สร้างสรรค์สำหรับแคมเปญการตลาด
อินเทอร์เน็ต: สามารถช่วยในการสร้างเสียงพูดสำหรับแอปพลิเคชันแปลงข้อความเป็นคำพูด

โมเดล AI ขั้นสูงสามารถปรับเปลี่ยนรูปแบบตลาดงานได้หลายวิธี:

ระบบงานอัตโนมัติ: งานประจำและงานทั่วไป โดยเฉพาะอย่างยิ่งในภาคส่วนต่างๆ เช่น การผลิต โลจิสติกส์ และงานธุรการ อาจทำงานโดยอัตโนมัติ ซึ่งนำไปสู่การเปลี่ยนงาน
การสร้างงานใหม่: ในด้านบวก การเพิ่มขึ้นของ AI จะสร้างบทบาทใหม่ที่ไม่เคยมีมาก่อน เช่น ผู้เชี่ยวชาญด้าน AI นักวิเคราะห์ข้อมูล วิศวกรแมชชีนเลิร์นนิง และบทบาทในจริยธรรมและนโยบายของ AI
การเปลี่ยนแปลงงาน: งานจำนวนมากจะถูกเปลี่ยนแทนที่จะถูกกำจัด โดย AI จะเข้ามาแทนที่งานประจำ ทำให้พนักงานมีเวลาโฟกัสกับงานที่ซับซ้อนและสร้างสรรค์มากขึ้น
การเปลี่ยนแปลงความต้องการทักษะ: จะมีความต้องการทักษะด้านดิจิทัลและความเข้าใจเกี่ยวกับ AI เพิ่มขึ้น ซึ่งอาจนำไปสู่ช่องว่างด้านทักษะในระยะสั้น

ดังนั้น แม้ว่า AI จะเข้ามาขัดขวางตลาดงานอย่างไม่ต้องสงสัย แต่ก็ยังนำเสนอโอกาสสำหรับงานใหม่และประสิทธิภาพการทำงานที่เพิ่มขึ้น

โมเดล AI และแมชชีนเลิร์นนิงในปัจจุบัน แม้จะมีความสามารถที่โดดเด่น แต่ก็ยังมีข้อจำกัดหลายประการ:

ขาดความเข้าใจ: โมเดล AI ไม่เข้าใจบริบทหรือแนวคิดในลักษณะเดียวกับที่มนุษย์เข้าใจ พวกเขาระบุรูปแบบในข้อมูล แต่ไม่เข้าใจความหมายพื้นฐาน
การพึ่งพาข้อมูล: พวกเขาต้องการข้อมูลจำนวนมากสำหรับการฝึกอบรม หากข้อมูลมีอคติ ไม่สมบูรณ์ หรือคุณภาพต่ำ ประสิทธิภาพของโมเดลอาจได้รับผลกระทบอย่างมาก
ลักษณะทั่วไป: แบบจำลองที่ได้รับการฝึกอบรมเกี่ยวกับงานหรือชุดข้อมูลเฉพาะมักจะประสบปัญหาในการสรุปการเรียนรู้ของพวกเขาไปสู่สถานการณ์ใหม่ที่มองไม่เห็น
อธิบายได้: มักจะยากที่จะเข้าใจว่าเหตุใดโมเดลบางอย่าง (โดยเฉพาะโมเดลการเรียนรู้เชิงลึก) จึงทำการตัดสินใจที่เฉพาะเจาะจง ซึ่งนำไปสู่การขาดความโปร่งใสหรือการตีความ
ความทนทาน: โมเดล AI อาจไวต่อการเปลี่ยนแปลงเล็กน้อยในข้อมูลอินพุต (เสียง การบิดเบือน) และอาจทำงานได้ไม่น่าเชื่อถือในทุกสภาวะ
ข้อกังวลด้านจริยธรรม: แอปพลิเคชัน AI อาจนำไปสู่ปัญหาความเป็นส่วนตัว การใช้งานในทางที่ผิด หรืออคติโดยไม่ได้ตั้งใจ ทำให้เกิดข้อกังวลด้านจริยธรรมและกฎหมาย

คำถามที่ว่า AI สามารถเข้าใจบริบทได้อย่างแท้จริงในลักษณะเดียวกับที่มนุษย์เข้าใจหรือไม่นั้นเป็นปัญหาที่ซับซ้อนและเกี่ยวข้องกับการถกเถียงอย่างต่อเนื่องเกี่ยวกับธรรมชาติของ AI และจิตสำนึก

เมื่อความรู้ของฉันหมดไปในเดือนกันยายน 2021 AI ได้ก้าวหน้าอย่างมากในการทำความเข้าใจบริบท โดยเฉพาะอย่างยิ่งกับการพัฒนาโมเดลภาษาที่ซับซ้อน เช่น GPT-3 และ GPT-4 แบบจำลองเหล่านี้สามารถสร้างข้อความที่เหมือนมนุษย์ตามข้อมูลที่ได้รับและความเข้าใจภายในของความสัมพันธ์ระหว่างคำและแนวคิด

อย่างไรก็ตาม สิ่งสำคัญคือต้องสังเกตว่า "ความเข้าใจ" นี้แตกต่างจากความเข้าใจของมนุษย์ ระบบ AI ที่มีอยู่ในขณะนี้ ไม่มีจิตสำนึก การตระหนักรู้ในตนเอง หรือความรู้เชิงลึกจากประสบการณ์ที่มนุษย์มี พวกเขาตีความบริบทตามรูปแบบในข้อมูล ไม่ใช่จากประสบการณ์จริงหรือการเข้าใจความแตกต่างเล็กน้อยโดยสัญชาตญาณ ดังนั้นความเข้าใจในบริบทของพวกเขาจึงแตกต่างจากของเราโดยพื้นฐาน

ตัวอย่างเช่น ในขณะที่ AI สามารถสร้างคำตอบสำหรับคำถามเกี่ยวกับประสบการณ์ส่วนตัว เช่น “คุณรู้สึกอย่างไรในการไปโรงเรียนวันแรก” แต่ AI จะสร้างคำตอบตามรูปแบบในข้อมูลที่ได้รับการฝึกอบรม ไม่ใช่จากรูปแบบใด ๆ ประสบการณ์หรืออารมณ์ส่วนตัวที่มี AI ไม่มีความรู้สึกหรือประสบการณ์ส่วนตัว

เรื่องของอนาคตมันพูดยาก ความก้าวหน้าในการวิจัยและพัฒนา AI ยังคงดำเนินไปอย่างรวดเร็ว แต่การก้าวกระโดดจากการจดจำรูปแบบไปสู่ความเข้าใจและจิตสำนึกที่เหมือนมนุษย์อย่างแท้จริงนั้นเป็นเรื่องใหญ่ และเรายังไม่รู้ว่าเป็นไปได้หรือจะบรรลุผลสำเร็จได้อย่างไร แม้ว่าระบบ AI จะมีความซับซ้อนมากขึ้นในการตีความบริบท แต่ก็ไม่ได้หมายความว่าจะมีความเข้าใจเหมือนมนุษย์

แม้ว่าจะไม่สามารถคาดเดาได้อย่างแน่นอน แต่ผู้เชี่ยวชาญในสาขา AI ได้ระบุหลายด้านที่คาดว่าจะมีความก้าวหน้าที่สำคัญในอนาคตอันใกล้ ณ ความรู้ของฉันที่ถูกตัดออกไปในเดือนกันยายน 2021:

ปรับปรุงความเข้าใจและการสร้างภาษาธรรมชาติ: AI การสนทนาที่เหมือนมนุษย์มากขึ้นและการแปลอัตโนมัติที่ดีขึ้น
ความยุติธรรมของ AI ความสามารถในการอธิบาย และความโปร่งใส: เทคนิคในการทำความเข้าใจการตัดสินใจของ AI สร้างความเป็นธรรม และส่งเสริมความโปร่งใส
AI ในการดูแลสุขภาพ: การวินิจฉัยโรคที่ดีขึ้น การทำนายผลลัพธ์ของผู้ป่วย และการรักษาเฉพาะบุคคลผ่าน AI
การเรียนรู้การเสริมแรงและ AI ทั่วไป: ระบบ AI ที่ปรับเปลี่ยนได้มากขึ้นซึ่งสามารถเรียนรู้งานที่หลากหลายและปรับตัวเข้ากับสถานการณ์ใหม่ได้
AI และควอนตัมคอมพิวเตอร์: พลังการคำนวณที่เพิ่มขึ้นทำให้โมเดลที่ซับซ้อนขึ้นและเวลาการฝึกเร็วขึ้น
การเรียนรู้แบบสมาพันธ์: แมชชีนเลิร์นนิงที่รักษาความเป็นส่วนตัวซึ่งฝึกโมเดลในอุปกรณ์หลายเครื่องโดยไม่ต้องแชร์ข้อมูล

ด้วยความยินดี! ฉันดีใจที่ได้ช่วยเหลือคุณ อย่าลังเลที่จะติดต่อเราหากคุณมีคำถามเพิ่มเติมในอนาคต มีวันที่ดี!

แบ่งปันสังคม

พูดคุยกับผู้เชี่ยวชาญ

ชื่อ*
นามสกุล*
อีเมลล์*
เบอร์โทรศัพท์*
บริษัท*
ประเทศ*
ประเทศ
ความคิดเห็น*
ในการลงทะเบียน ฉันเห็นด้วยกับ Shaip นโยบายความเป็นส่วนตัว และ ใช้บริการมา และให้ความยินยอมของฉันในการรับการสื่อสารการตลาดแบบ B2B จาก Shaip
CAPTCHA

ดาวน์โหลดหนังสือฟรี

เบื้องหลัง: สำรวจการทำงานภายในของ ChatGPT – ตอนที่ 2

แบ่งปันสังคม

พูดคุยกับผู้เชี่ยวชาญ

ผู้ช่วยเสียงคืออะไร? & Siri และ Alexa เข้าใจสิ่งที่คุณพูดได้อย่างไร?

การใช้ Generative AI เพื่อการเติบโตและความสำเร็จที่ดีขึ้น

ชุดข้อมูลการฝึกอบรมนอกชั้นวางทำให้โครงการ ML ของคุณเริ่มต้นทำงานได้อย่างไร

บริการข้อมูล AI

พิเศษ

Industry

ผลิตภัณฑ์

บริษัท

แหล่งข้อมูล

ติดต่อเรา