Meta ซึ่งเป็นหนึ่งในผู้เล่นรายใหญ่ในอุตสาหกรรม ได้ประกาศเปิดตัวโมเดล AI “Self-Taught Evaluator” ใหม่ ซึ่งมีเป้าหมายเพื่อประเมินและฝึกโมเดล AI อื่นๆ โดยอัตโนมัติ
ปัญหาหลักประการหนึ่งในการพัฒนาโมเดล AI คือต้นทุนที่เกี่ยวข้อง ในสถานะปัจจุบันของอุตสาหกรรม จำเป็นต้องมีการลงทุนจำนวนมากเพื่อให้ตามทันและแข่งขันได้ นอกจากนี้ นักพัฒนายังใช้เทคนิคที่เรียกว่า “การเรียนรู้เสริมแรงจากคำติชมของมนุษย์” (RLAIF) ในระหว่างกระบวนการฝึกอบรม ตามชื่อของมัน RLAIF จำเป็นต้องมีการมีส่วนร่วมของมนุษย์ ซึ่งอาจทำให้กระบวนการดำเนินไปช้าลง อย่างไรก็ตาม Self-Taught Evaluator ใหม่ของ Meta มีเป้าหมายเพื่อขจัดข้อกำหนดดังกล่าว
โมเดล AI Self-Taught Evaluator ของ Meta สามารถฝึกและประเมิน AI อื่นๆ ได้โดยไม่ต้องมีการแทรกแซงจากมนุษย์
RLAIF ใช้ผู้เชี่ยวชาญที่เป็นมนุษย์เพื่อให้แน่ใจว่า AI ที่กำลังพัฒนาจะให้คำตอบที่มั่นคงและเชื่อถือได้ ท้ายที่สุดแล้ว AI จะทรงพลังเพียงใดก็ไม่สำคัญหากมันมีอัตราข้อผิดพลาดสูง ฝ่ายมนุษย์จะต้องตรวจสอบให้แน่ใจว่าข้อมูลที่ใช้ในกระบวนการฝึก AI นั้นถูกต้องตามข้อเท็จจริง ซึ่งไม่เพียงแต่เพิ่มเวลาในการพัฒนาเท่านั้น แต่ยังเพิ่มต้นทุนที่เกี่ยวข้องอีกด้วย
อย่างไรก็ตาม โมเดล Self-Taught Evaluator ของ Meta สามารถประเมินและฝึกโมเดล AI อื่นๆ ได้ เพื่อให้บรรลุเป้าหมายนี้ Self-Taught Evaluator ใช้เทคนิค “ห่วงโซ่แห่งความคิด” ที่ OpenAI นำไปใช้ในโมเดล o1 เทคนิคนี้ใช้การแก้ไขปัญหาที่ซับซ้อนโดยแบ่งปัญหาออกเป็นขั้นตอนตรรกะที่เล็กกว่า ส่งผลให้ได้คำตอบที่แม่นยำยิ่งขึ้นในด้านขั้นสูง เช่น วิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์
ในความเป็นจริง Meta พัฒนาโมเดล Self-Taught Evaluator เองโดยใช้เทคนิคห่วงโซ่แห่งความคิด พวกเขาใช้ข้อมูลที่สร้างขึ้นโดย AI ล้วนๆ เพื่อฝึกโมเดล “เราหวังว่าเมื่อ AI กลายเป็นสิ่งที่เหนือมนุษย์มากขึ้นเรื่อยๆ AI จะตรวจสอบการทำงานของตัวเองได้ดีขึ้นเรื่อยๆ จนดีกว่ามนุษย์ทั่วไป” Jason Weston หนึ่งในนักวิจัยที่เกี่ยวข้องกล่าว
AI ที่สามารถเรียนรู้และประเมินผลได้ด้วยตัวเองโดยไม่ต้องมีมนุษย์เข้ามาแทรกแซงดูเหมือนเป็นแนวคิดล้ำยุคที่หลุดออกมาจากภาพยนตร์นิยายวิทยาศาสตร์ อย่างไรก็ตาม ความคืบหน้าล่าสุดบ่งชี้ว่าเราอาจจะไม่ได้อยู่ไกลจากสิ่งนี้มากนัก ผู้เชี่ยวชาญด้าน AI แนะนำว่าการนำโมเดลดังกล่าวไปใช้ในสาขาต่างๆ อาจช่วยขจัดการแทรกแซงของมนุษย์ได้เป็นส่วนใหญ่