Nvidia lại bị cáo buộc thu thập dữ liệu AI từ Netflix và YouTube

Nvidia lại bị cáo buộc thu thập dữ liệu AI từ Netflix và YouTube

Ngày đăng: 12/08/2024 10:39

Theo một báo cáo đang nhận được rất nhiều sự chú ý từ 404 Media, Nvidia đã có hành vi lén lút thu thập nội dung video từ các nguồn trực tuyến như Netflix và YouTube để sử dụng cho các sản phẩm trí tuệ nhân tạo của mình mà hoàn toàn không xin phép.

Kết luận này được đưa ra sau khi 404 Media thu thập được với nguồn thông tin rò rỉ từ các cuộc trò chuyện nội bộ của Nvidia trên Slack, email và tài liệu nội bộ của hãng. Nvidia đã tự giúp mình có được "trải nghiệm hình ảnh tương đương với dữ liệu đào tạo trong suốt cuộc đời con người mỗi ngày", Ming-Yu Liu, phó chủ tịch phụ trách nghiên cứu tại Nvidia kiêm trưởng nhóm dự án Cosmos, thừa nhận trong một email vào tháng 5. Dự án Cosmos này nhằm mục đích xây dựng một mô hình ngôn ngữ lớn mang tính nền tảng cho Nvidia, tương tự như các dự án Gemini 1.5 của Google, OpenAI GPT-4 hay Llama 3.1 của Meta.

Các cựu nhân viên giấu tên của Nvidia nói với 404 Media rằng họ đã được yêu cầu thu thập nội dung video từ Netflix, YouTube và các nguồn trực tuyến lớn khác, biến chúng thành dữ liệu đào tạo để sử dụng với các sản phẩm AI khác nhau của công ty.

Để thực hiện điều này, dự án Cosmos được cho là đã sử dụng một trình download video nguồn mở và sử dụng máy học để xử lý IP, do đó tránh được các nỗ lực chặn của YouTube. Theo thông tin rò rỉ, các nhà quản lý dự án đã thảo luận về việc sử dụng tới 30 máy ảo chạy trên Amazon Web Services để tải xuống một lượng video có thời lượng tương đương khoảng 80 năm, cùng vô số clip riêng lẻ mỗi ngày. Khi những nhân viên này thắc mắc về tính hợp pháp của dự án Cosmos, ban lãnh đạo công ty đảm bảo rằng họ đã được các đối tác cho phép sử dụng nội dung đó.

Về phần mình, Nvidia tuyên bố không có hành vi sai trái nào. "Chúng tôi tôn trọng quyền của tất cả những người sáng tạo nội dung và tin tưởng rằng các mô hình và nỗ lực nghiên cứu của chúng tôi tuân thủ đầy đủ theo đúng nghĩa đen và tinh thần của luật bản quyền", một phát ngôn viên của Nvidia đã nói với 404 Media qua email. "Luật bản quyền bảo vệ các biểu đạt cụ thể nhưng không bảo vệ các sự kiện, ý tưởng, dữ liệu hoặc thông tin. Bất kỳ ai cũng có quyền tự do tìm hiểu các sự kiện, ý tưởng, dữ liệu hoặc thông tin từ một nguồn khác và sử dụng chúng để tạo ra các biểu đạt của riêng họ. Sử dụng hợp lý cũng bảo vệ khả năng sử dụng một tác phẩm cho mục đích chuyển đổi, chẳng hạn như đào tạo mô hình AI".

Đây không phải là lần đầu tiên Nvidia (chưa kể đến phần lớn các công ty còn lại trong lĩnh vực AI) áp dụng cách làm theo kiểu "tiền trảm hậu tấu" trong việc thu thập dữ liệu đào tạo AI của mình. Vào tháng 7, Nvidia cũng đã bị réo tên trong một báo cáo khác về việc thu thập bất hợp pháp các video có bản quyền làm dữ liệu training AI.

Tại CES 2024, Nvidia đã gây tranh cãi với những câu trả lời mơ hồ về cách thức đào tạo công cụ AI tạo sinh mới cho trò chơi. Đáp lại, công ty khẳng định lại rằng các công cụ của họ "an toàn về mặt thương mại". Nhưng sự thật thế nào? Hãy cùng chờ xem!

Những tin tức khác

Danh mục tin tức

LIÊN LẠC - TƯ VẤN

HOTLINE HÀ NỘI
0911 047 055
HOTLINE SÀI GÒN
0911 533 299

Trụ sở Hà Nội - Showroom - Bảo hành:
• Địa chỉ: 44C Ngõ 89 Tứ Liên, P. Tứ Liên, Q. Tây Hồ, Hà Nội
• Điện thoại: (024) 3514.9887 - 3514 9905 (Hotline Hà Nội: 0911 047 055)
• Email: sales@fastest.com.vn

CN TP.HCM - Showroom - Bảo hành:
• Địa chỉ: 488/15B Cộng Hòa, Phường 13, Q. Tân Bình, TP.HCM
• Điện thoại: (028) - 3948 3536 - 3948 3537 (Hotline Sài Gòn: 0911 533 299)
• Email: sales@fastest.com.vn

Giới thiệu về FASTEST

FASTEST - Thành lập từ 2004 với niềm đam mê công nghệ cao. Bắt đầu với việc sử dụng Ni Tơ lỏng để Ép Xung cho CPU. Dần Dần đi sâu vào hàng chuyên dụng và kể từ đó đã tạo nên FASTEST ngày hôm nay. Chuyên cung cấp giải pháp công nghệ thông tin cho các Doanh Nghiệp tại Việt Nam và cả một số nước trong khu vực Đông Nam Á.

Xem thêm

CÔNG TY CỔ PHẦN ANH ĐỨC

Giấy chứng nhận đăng ký kinh doanh CTCP số: 0103005889 – Ngày 16/11/2004 - MST: 0101 592 592

CÔNG TY CỔ PHẦN ANH ĐỨC

Trụ sở Hà Nội

Chi nhánh TP. HCM

Supermicro Server

Dell Server

HPE Server

Nvidia Server

ASUS SERVER

AI SEVER

Storage SEAGATE (Enterprise Data Solutions)

Storage HP

Storage DELL

For Content Creators

For Engineering

Chassis

Mainboard Supermicro

Mainboard Asus

CPU INTEL

HDD Server

SSD Server

Ram Server

Card VGA

CARD RAID

Add-on Card

Deep Learning / AI Solutions

Card Mạng

Workstation for AI