Nvidia ได้เปิดตัว NVLM 1.0 โมเดลปัญญาประดิษฐ์โอเพ่นซอร์สอันทรงพลังที่สามารถแข่งขันกับระบบ
ที่เป็นครองคตลาดของผู้นำในอุตสาหกรรมอย่าง OpenAI และ Google ได้
ตระกูล NVLM 1.0 ใหม่ของบริษัทซึ่งประกอบด้วยโมเดลภาษาหลายโหมดขนาดใหญ่ นำโดย NVLM-D-72B ที่มีพารามิเตอร์ 72 พันล้านตัว แสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นในงานด้านการมองเห็นและภาษา ขณะเดียวกันก็ช่วยเสริมความสามารถเฉพาะข้อความด้วย
คุณพร้อมสำหรับเอเจนต์ AI แล้วหรือยัง
นักวิจัยได้อธิบายไว้ในเอกสารว่า “เราขอแนะนำ NVLM 1.0 ซึ่งเป็นตระกูลของโมเดลภาษาหลายโหมดขนาดใหญ่ระดับแนวหน้าซึ่งให้ผลลัพธ์ที่ล้ำสมัยในงานด้านการมองเห็นและภาษา ซึ่งสามารถแข่งขันกับโมเดลที่เป็นกรรมสิทธิ์ชั้นนำ (เช่น GPT-4o) และโมเดลแบบโอเพ่นแอ็กเซสได้”
ด้วยการทำให้น้ำหนักของโมเดลเปิดเผยต่อสาธารณะและสัญญาว่าจะเผยแพร่โค้ดฝึกอบรม Nvidia จึงแหกกฎของการปิดระบบ AI ขั้นสูง การตัดสินใจครั้งนี้ทำให้ผู้วิจัยและนักพัฒนาเข้าถึงเทคโนโลยีล้ำสมัยได้อย่างไม่เคยมีมาก่อน
ผลการเปรียบเทียบประสิทธิภาพการทำงานระหว่างโมเดล NVLM-D ของ NVIDIA กับ AI ยักษ์ใหญ่ เช่น GPT-4, Claude 3.5 และ Llama 3-V แสดงให้เห็นประสิทธิภาพการทำงานที่แข่งขันได้ของ NVLM-D ในงานด้านภาพและภาษาต่างๆ (เครดิต: arxiv.org)
NVLM-D-72B: ตัวแสดงประสิทธิภาพการทำงานที่หลากหลายในงานด้านภาพและข้อความ โมเดล NVLM-D-72B แสดงให้เห็นถึงความสามารถในการปรับตัวที่น่าประทับใจในการประมวลผลข้อมูลอินพุตภาพและข้อความที่ซับซ้อน นักวิจัยได้ให้ตัวอย่างที่เน้นถึงความสามารถของโมเดลในการตีความมีม วิเคราะห์ภาพ และแก้ปัญหาทางคณิตศาสตร์ทีละขั้นตอน
ที่น่าสังเกตคือ NVLM-D-72B ปรับปรุงประสิทธิภาพการทำงานในงานที่เป็นข้อความเท่านั้นหลังจากการฝึกแบบหลายโหมด แม้ว่าโมเดลที่คล้ายกันหลายตัวจะพบว่าประสิทธิภาพของข้อความลดลง แต่ NVLM-D-72B กลับเพิ่มความแม่นยำได้โดยเฉลี่ย 4.3 จุดในเกณฑ์มาตรฐานข้อความที่สำคัญ
นักวิจัยตั้งข้อสังเกตว่า “NVLM-D-1.0-72B ของเราแสดงให้เห็นถึงการปรับปรุงที่สำคัญเหนือโครงข่ายข้อความในเกณฑ์มาตรฐานคณิตศาสตร์และการเข้ารหัสแบบข้อความเท่านั้น” โดยเน้นย้ำถึงข้อได้เปรียบหลักของแนวทางดังกล่าว
โมเดล AI ใหม่ของ NVIDIA วิเคราะห์มีมที่เปรียบเทียบบทคัดย่อทางวิชาการกับเอกสารฉบับสมบูรณ์ แสดงให้เห็นถึงความสามารถในการตีความอารมณ์ขันทางภาพและแนวคิดทางวิชาการ (เครดิต: arxiv.org)
นักวิจัย AI ตอบสนองต่อโครงการโอเพ่นซอร์สของ Nvidia
ชุมชน AI ตอบสนองในเชิงบวกต่อการเปิดตัว นักวิจัย AI คนหนึ่งแสดงความคิดเห็นบนโซเชียลมีเดียว่า “ว้าว! Nvidia เพิ่งเผยแพร่โมเดล 72B ซึ่งเทียบเท่ากับ llama 3.1 405B ในการประเมินคณิตศาสตร์และการเข้ารหัส และยังมี Vision ด้วย”
การตัดสินใจของ Nvidia ที่จะทำให้โมเดลอันทรงพลังดังกล่าวพร้อมใช้งานแบบเปิดอาจเร่งการวิจัยและพัฒนา AI ในทุกสาขา การให้สิทธิ์เข้าถึงโมเดลที่แข่งขันกับระบบที่เป็นกรรมสิทธิ์ของบริษัทเทคโนโลยีที่มีเงินทุนหนา Nvidia อาจช่วยให้องค์กรขนาดเล็กและนักวิจัยอิสระมีส่วนสนับสนุนความก้าวหน้าของ AI ได้อย่างมีนัยสำคัญยิ่งขึ้น
โครงการ NVLM ยังแนะนำการออกแบบสถาปัตยกรรมที่สร้างสรรค์ รวมถึงแนวทางไฮบริดที่ผสมผสานเทคนิคการประมวลผลแบบหลายโหมดที่แตกต่างกัน การพัฒนานี้สามารถกำหนดทิศทางของการวิจัยในอนาคตในสาขานี้ได้
NVLM 1.0: บทใหม่ในการพัฒนา AI แบบโอเพ่นซอร์ส
การเปิดตัว NVLM 1.0 ของ Nvidia ถือเป็นช่วงเวลาสำคัญในการพัฒนา AI ด้วยการโอเพ่นซอร์สโมเดลที่แข่งขันกับยักษ์ใหญ่ที่เป็นกรรมสิทธิ์ Nvidia ไม่ได้แค่แบ่งปันโค้ดเท่านั้น แต่ยังท้าทายโครงสร้างของอุตสาหกรรม AI อีกด้วย
การเคลื่อนไหวนี้อาจจุดชนวนปฏิกิริยาลูกโซ่ ผู้นำด้านเทคโนโลยีรายอื่นๆ อาจรู้สึกกดดันให้เปิดเผยการวิจัยของตน ซึ่งอาจเร่งความก้าวหน้าของ AI ให้เร็วขึ้นในทุกด้าน นอกจากนี้ยังทำให้สนามแข่งขันมีความเท่าเทียมกัน ช่วยให้ทีมงานและนักวิจัยขนาดเล็กสามารถสร้างสรรค์นวัตกรรมด้วยเครื่องมือที่เคยสงวนไว้สำหรับยักษ์ใหญ่ด้านเทคโนโลยี
อย่างไรก็ตาม การเปิดตัว NVLM 1.0 ก็มีความเสี่ยงเช่นกัน เมื่อ AI ที่ทรงพลังเข้าถึงได้มากขึ้น ความกังวลเกี่ยวกับการใช้งานในทางที่ผิดและผลกระทบทางจริยธรรมก็มีแนวโน้มที่จะเพิ่มขึ้น ชุมชน AI ในปัจจุบันต้องเผชิญกับภารกิจที่ซับซ้อนในการส่งเสริมนวัตกรรมในขณะที่สร้างแนวป้องกันสำหรับการใช้งานอย่างรับผิดชอบ
การตัดสินใจของ Nvidia ยังทำให้เกิดคำถามเกี่ยวกับอนาคตของรูปแบบธุรกิจ AI อีกด้วย หากรูปแบบที่ล้ำสมัยมีให้ใช้งานฟรี บริษัทต่างๆ อาจต้องคิดใหม่ว่าจะสร้างมูลค่าและรักษาความได้เปรียบในการแข่งขันใน AI ได้อย่างไร
ผลกระทบที่แท้จริงของ NVLM 1.0 จะเกิดขึ้นในอีกไม่กี่เดือนและไม่กี่ปีข้างหน้า ซึ่งอาจนำไปสู่ยุคแห่งความร่วมมือและนวัตกรรมที่ไม่เคยมีมาก่อนใน AI หรืออาจบังคับให้ต้องพิจารณาผลที่ตามมาโดยไม่ได้ตั้งใจของ AI ขั้นสูงที่มีให้ใช้กันอย่างแพร่หลาย
สิ่งหนึ่งที่แน่นอนคือ Nvidia ได้ยิงกระสุนใส่หัวเรือของอุตสาหกรรม AI คำถามในตอนนี้ไม่ใช่ว่าภูมิทัศน์จะเปลี่ยนไปหรือไม่ แต่เป็นว่าจะเปลี่ยนแปลงไปอย่างมากเพียงใด และใครจะปรับตัวได้เร็วพอที่จะเจริญเติบโตในโลกใหม่ของ AI แบบเปิดนี้