OpenAI bị yêu cầu giao nộp 20 triệu bản ghi ChatGPT trong vụ kiện bản quyền với NYT

Tóm tắt

  • Phán quyết buộc OpenAI phải cung cấp 20 triệu nhật ký trò chuyện sau nhiều tháng tranh chấp về quyền riêng tư, lưu trữ và phạm vi.
  • Thẩm phán Ona T. Wang phán quyết rằng kích thước mẫu này là “tương xứng” với những gì vụ kiện cần để xác minh liệu đầu ra của ChatGPT có sao chép nội dung của Times hay không.
  • Vụ kiện gia nhập làn sóng ngày càng gia tăng các thách thức về bản quyền nhắm vào cách các phòng thí nghiệm AI lấy nguồn và sử dụng dữ liệu huấn luyện.

Trung tâm Nghệ thuật, Thời trang và Giải trí của Decrypt.


Khám phá SCENE

Một thẩm phán liên bang đã ra lệnh cho OpenAI phải giao nộp khoảng 20 triệu nhật ký ChatGPT đã được ẩn danh cho The New York Times và các nguyên đơn khác, làm gia tăng mức độ phơi bày của công ty phát triển AI này trước hàng loạt tranh chấp về bản quyền và quản trị dữ liệu.

Lệnh được ban hành vào thứ Tư tại New York, từ chối đề nghị của OpenAI nhằm ngăn chặn việc cung cấp hồ sơ trò chuyện của người dùng và yêu cầu công ty phải bàn giao các nhật ký này theo một khuôn khổ bảo vệ.

Kết quả này có thể định hình cách các công ty công nghệ như OpenAI, Anthropic và Perplexity lấy nguồn dữ liệu huấn luyện, cấp phép nội dung và xây dựng các hàng rào bảo vệ đối với những gì hệ thống của họ có thể xuất ra.

Mặc dù tòa án “nhận thấy các cân nhắc về quyền riêng tư của người dùng OpenAI là chân thành”, nhưng những cân nhắc này “chỉ là một yếu tố trong phân tích tính tương xứng, và không thể chiếm ưu thế khi có liên quan rõ ràng và gánh nặng tối thiểu”, Thẩm phán liên bang Ona T. Wang viết.

Decrypt đã liên hệ cả hai bên để lấy ý kiến.

Lệnh này xuất phát từ vụ kiện đang diễn ra của Times, cáo buộc các mô hình của OpenAI đã được huấn luyện trên nội dung tin tức có bản quyền mà không được phép. Vụ kiện lần đầu tiên được đưa ra vào tháng 12 năm 2023.

Vào tháng 1 năm ngoái, OpenAI đã thách thức các cáo buộc của NYT và đệ đơn kiện ngược, cho rằng tờ báo này không “kể toàn bộ câu chuyện”.

Sau đó, tòa án nhận thấy rằng 20 triệu mẫu nhật ký trò chuyện liên quan là “tương xứng với nhu cầu của vụ kiện” để đánh giá liệu đầu ra của ChatGPT có sao chép tài liệu của NYT hay không.

Trong năm qua, tranh chấp ngày càng gay gắt hơn, với phía nguyên đơn thúc ép quyền truy cập rộng rãi vào dữ liệu đầu ra, còn OpenAI cảnh báo rằng việc sản xuất mở rộng các tài liệu này sẽ làm tăng gánh nặng về quyền riêng tư và vận hành.

Vào tháng 6, OpenAI gặp thêm trở ngại khi tòa án yêu cầu công ty phải giữ lại một loạt dữ liệu người dùng ChatGPT cho vụ kiện, bao gồm cả các cuộc trò chuyện mà người dùng có thể đã xóa.

Vài tháng sau, vào tháng 10, tranh chấp lại bùng phát, khi tòa án lưu ý về hồ sơ ngày 20 tháng 10 của OpenAI (ECF 679) thách thức việc cung cấp mẫu 20 triệu nhật ký, và yêu cầu cả hai bên gửi giải thích về lý do bất đồng.

Vào thời điểm đó, thẩm phán yêu cầu các bên giải thích cách cuộc tranh luận liên quan đến những lo ngại trước đó về nhật ký đã bị xóa và liệu OpenAI có rút lại các thỏa thuận trước đây về những gì họ từng cam kết sẽ cung cấp hay không.

Cuối tháng trước, OpenAI đã đệ đơn phản đối chính thức yêu cầu thẩm phán quận lật lại lệnh khám phá của thẩm phán liên bang.

Công ty lập luận rằng phán quyết là “rõ ràng sai lầm” và “không tương xứng”, vì nó sẽ buộc công ty phải tiết lộ hàng triệu cuộc trò chuyện riêng tư của người dùng, theo một tài liệu tòa án được đại diện OpenAI chia sẻ với Decrypt.

Tranh chấp này diễn ra như một phần của làn sóng phản đối rộng lớn hơn đối với các phòng thí nghiệm AI, khi các tác giả, tổ chức báo chí, nhà xuất bản âm nhạc và kho mã nguồn tìm cách kiểm nghiệm phạm vi của luật bản quyền hiện hành khi các mô hình AI tiếp nhận và tái tạo tài liệu được bảo vệ.

Các tòa án trên khắp Hoa Kỳ và châu Âu hiện đang xử lý những tuyên bố tương tự.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hotXem thêm
  • Vốn hóa:$3.69KNgười nắm giữ:5
    0.69%
  • Vốn hóa:$3.5KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$3.51KNgười nắm giữ:2
    0.09%
  • Vốn hóa:$3.47KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$3.52KNgười nắm giữ:2
    0.00%
  • Ghim