NVIDIA ถูกกล่าวหาว่าขโมยวิดีโอ YouTube จำนวนมากเพื่อฝึก AI โดยไม่ได้รับอนุญาต

404 Media ปล่อยเอกสารที่รั่วไหลซึ่งที่อ้างว่าได้รับมา เพื่อเผยให้เห็นว่า Nvidia ยักษ์ใหญ่ด้านชิปที่ขับเคลื่อนด้วย AI ได้ขโมยข้อมูลวิดีโอ YouTube จำนวนมากอย่างเงียบๆ เพื่อฝึกโมเดล AI ซึ่งเป็นการตัดสินใจที่คลุมเครือทั้งทางกฎหมายและจริยธรรม

ตามข้อมูลวงในของ 404 ทาง Nvidia ได้รับข้อมูลจาก YouTube จำนวนมากเพื่อฝึกโมเดล AI รวมถึงโมเดล Deep Learning อย่าง Cosmos อัลกอริทึมของรถยนต์ขับเคลื่อนอัตโนมัติ ผลิตภัณฑ์อวาตาร์ AI “Digital Human” และเครื่องมือสร้างโลกสามมิติที่เรียกว่า Omniverse

นอกจากนี้ Nvidia ยังพยายามอย่างยิ่งที่จะซ่อนกิจกรรมของตนจาก YouTube โดยใช้ “Virtual Machine” หลายสิบเครื่องที่เปลี่ยนที่อยู่ IP โดยอัตโนมัติเพื่อหลีกเลี่ยงการตรวจจับ

ทั้งผู้สร้างวิดีโอรายบุคคลและเจ้าของ YouTube อย่าง Google ซึ่งเป็นลูกค้ารายสำคัญของ Nvidia ไม่ยินยอมให้ Nvidia ขูดข้อมูล และการติดต่อภายในระหว่างพนักงานของ Nvidia รวมถึงจากผู้บริหารระดับสูง เผยให้เห็นถึงวิธีการที่หุนหันพลันแล่นอย่างมากในการรณรงค์ดูดข้อมูลอย่างลับๆ

Ming-Yu Liu รองประธานฝ่ายวิจัยของ Nvidia และผู้นำโครงการ Cosmos เขียนในอีเมลเมื่อเดือนพฤษภาคมว่า “เรากำลังดำเนินการขั้นสุดท้ายสำหรับท่อข้อมูล v1 และจัดหาทรัพยากรคอมพิวเตอร์ที่จำเป็น” ตามรายงานของ 404 “เพื่อสร้างโรงงานข้อมูลวิดีโอที่สามารถให้ประสบการณ์ภาพชีวิตมนุษย์ที่เทียบเท่ากับข้อมูลการฝึกอบรมต่อวัน”

ยิ่งไปกว่านั้น เพื่อตอบสนองต่อความกังวลของพนักงานเกี่ยวกับความถูกต้องตามกฎหมาย และจริยธรรมของแนวทางการรวบรวมข้อมูลใหม่ของ Nvidia ผู้จัดการรวมถึง Liu ยืนกรานว่าการดำเนินการดังกล่าวได้รับการอนุมัติจากบนลงล่าง

“นี่เป็นการตัดสินใจของฝ่ายบริหาร” Liu เขียนถึงลูกน้องที่ลังเลใจในโอกาสดังกล่าวครั้งหนึ่ง ตามข้อความใน Slack ที่ 404 ตรวจสอบ “เรามีการอนุมัติแบบครอบคลุมสำหรับข้อมูลทั้งหมด”

ในกรณีที่น่าตกตะลึงเป็นพิเศษ เอกสารที่ 404 ได้รับมาเผยให้เห็นว่าในบางจุด Nvidia ตั้งใจฝึกโมเดลของตนบน HD-VG-130M ซึ่งเป็นชุดข้อมูลที่ฝึกบนวิดีโอ YouTube 130 ล้านรายการที่สร้างขึ้นโดยเฉพาะสำหรับการวิจัยทางวิชาการ เนื่องจาก Nvidia ใช้ข้อมูลทางวิชาการนั้นในการฝึกโมเดลเชิงพาณิชย์ มันจึงดูแย่มาก

Shayne Longpre นักศึกษาปริญญาเอกจาก MIT Media Lab กล่าวกับ 404 ว่า “ฉันคิดว่ามีช่องว่างขนาดใหญ่ระหว่างการนำบางสิ่งออกสู่ตลาดโดยไม่ได้รับความยินยอมจากใครบางคน” “กับการศึกษาความสามารถของ AI เชิงสร้างสรรค์ที่อ้างอิงจากสิ่งที่เผยแพร่สู่สาธารณะทางออนไลน์”

Nvidia ได้ก้าวขึ้นมาเป็นผู้เล่นหลักในอุตสาหกรรม AI เนื่องจากมีอำนาจเหนือตลาดเหนือหน่วยประมวลผลกราฟิก (GPU) ซึ่งเป็นชิปคอมพิวเตอร์ที่มักรองรับระบบ AI ที่เน้นการประมวลผลเป็นหลัก บริษัท AI ต่างๆ เช่น OpenAI, Microsoft, Meta และอีกครั้ง Google นับตัวเองเป็นลูกค้าของ Nvidia ทำให้การใช้ข้อมูลของ Google อย่างลับๆ ของ Nvidia กลายเป็นเรื่องอื้อฉาวมากยิ่งขึ้น ผู้เล่นรายใหญ่ในอุตสาหกรรม AI ทุกรายกำลังต่อสู้เพื่อครอบครองตลาด รวมถึง Nvidia ซึ่งเป็นผู้เล่นหลักหลักของตลาดฮาร์ดแวร์ และปัจจุบันก็เป็นศัตรูตัวฉกาจ

เมื่อ 404 ถามถึงแนวทางการขูดข้อมูลของ Nvidia ทางโฆษกของ Google ก็ได้ชี้ไปที่การสัมภาษณ์เมื่อเดือนเมษายน ซึ่ง Neal Mohan ซีอีโอของ YouTube กล่าวกับ Bloomberg ว่าการใช้ข้อมูลของ YouTube โดยไม่ได้รับอนุญาตถือเป็น “การละเมิด” ข้อกำหนดในการให้บริการของแพลตฟอร์มอย่างชัดเจน

“เมื่อผู้สร้างอัปโหลดผลงานหนักของตนไปยังแพลตฟอร์มของเรา พวกเขามีความคาดหวังบางอย่าง” Mohan บอกกับ Bloomberg “ความคาดหวังอย่างหนึ่งคือจะต้องปฏิบัติตามข้อกำหนดในการให้บริการ ซึ่งไม่อนุญาตให้ดาวน์โหลดสิ่งต่างๆ เช่น คำบรรยายหรือวิดีโอ และนั่นถือเป็นการละเมิดข้อกำหนดในการให้บริการของเราอย่างชัดเจน”

ในคำชี้แจงต่อ 404 Nvidia อ้างว่าแนวทางการฝึก AI ของตน “เป็นไปตามตัวอักษรและเจตนารมณ์ของกฎหมายลิขสิทธิ์อย่างสมบูรณ์” แน่นอนว่าคณะลูกขุนยังคงถกเถียงกันอยู่ว่ามนุษย์ที่สร้างเนื้อหาที่มีมูลค่าตลอดอายุขัยซึ่งปัจจุบันเป็นกำลังขับเคลื่อนระบบ AI ของผู้ผลิตชิปรู้สึกอย่างไรเกี่ยวกับเรื่องนี้

Source

jetboat

Eminem ฟาดฝีปากกับ Slim Shady AI ของตัวเองที่ย้อนอดีตมาจากปี 2002

AIS ยินดีต้อนรับ Deutsche Telekom เข้าสู่ Bridge Alliance

Related Articles

เจาะลึก Galaxy Z Fold 8 Ultra ข้อมูลหลุดล่าสุดจาก FCC ยันดีไซน์เดิม แต่สเปกจัดเต็ม!

McDonald’s ทดสอบ AI สั่งอาหาร Drive-thru “Archy” ร่วมกับ Google แล้ว!

watchOS 27, iPadOS 27, macOS 27 Golden Gate: อุปกรณ์ไหนจะหมดสิทธิอัปเดต?

HONOR จับมือ POP MART เปิดตัว ‘HONOR 600 Pro x POP MART MOLLY Limited Edition’ ฉลองครบรอบ 20 ปี MOLLY