Putusan tersebut memaksa OpenAI untuk menyediakan 20 juta log percakapan setelah berbulan-bulan perselisihan mengenai privasi, pelestarian, dan cakupan.
Hakim Ona T. Wang memutuskan bahwa ukuran sampel tersebut “proporsional” dengan kebutuhan kasus untuk membuktikan apakah output ChatGPT mereproduksi konten Times.
Kasus ini bergabung dengan gelombang tantangan hak cipta yang semakin berkembang yang menyoroti bagaimana laboratorium AI mendapatkan dan menggunakan data pelatihan.
Pusat Seni, Fashion, dan Hiburan Decrypt.
Temukan SCENE
Seorang hakim federal telah memerintahkan OpenAI untuk menyerahkan sekitar 20 juta log ChatGPT yang telah dianonimkan kepada The New York Times dan penggugat lainnya, semakin memperluas eksposur perusahaan pengembang AI tersebut terhadap berbagai sengketa hak cipta dan tata kelola data.
Dikeluarkan pada hari Rabu di New York, perintah tersebut menolak upaya OpenAI untuk memblokir produksi catatan percakapan pengguna dan mengarahkan perusahaan untuk menyerahkan log tersebut di bawah kerangka perlindungan.
Hasilnya dapat membentuk bagaimana perusahaan teknologi seperti OpenAI, Anthropic, dan Perplexity mendapatkan data pelatihan, melisensikan konten, dan membangun pembatasan atas apa yang dapat dihasilkan sistem mereka.
Meskipun pengadilan “mengakui bahwa pertimbangan privasi pengguna OpenAI adalah tulus,” pertimbangan tersebut “hanya satu faktor dalam analisis proporsionalitas, dan tidak dapat mendominasi ketika terdapat relevansi yang jelas dan beban yang minimal,” tulis Hakim Magistrate AS Ona T. Wang.
Decrypt telah menghubungi kedua pihak untuk memberikan komentar.
Perintah ini berasal dari gugatan yang sedang berlangsung oleh Times, yang menuduh bahwa model OpenAI dilatih menggunakan konten berita yang memiliki hak cipta tanpa izin. Gugatan ini pertama kali diajukan pada Desember 2023.
Pada Januari tahun lalu, OpenAI menantang klaim NYT dan mengajukan gugatan balik, dengan menyatakan bahwa publikasi tersebut tidak “menceritakan seluruh cerita.”
Pengadilan kemudian menemukan bahwa 20 juta sampel log percakapan yang dimaksud adalah “proporsional dengan kebutuhan kasus” untuk menilai apakah output ChatGPT menyalin materi milik NYT.
Selama setahun terakhir, perselisihan semakin memanas, dengan para penggugat mendesak akses luas ke data output, sementara OpenAI memperingatkan bahwa produksi materi secara luas ini akan menimbulkan beban privasi dan operasional.
Pada bulan Juni, OpenAI mengalami kemunduran lain ketika pengadilan memerintahkan perusahaan untuk menyimpan berbagai data pengguna ChatGPT untuk keperluan gugatan, termasuk percakapan yang mungkin sudah dihapus oleh pengguna.
Beberapa bulan kemudian, pada bulan Oktober, perselisihan muncul kembali, dengan pengadilan menyoroti pengajuan OpenAI pada 20 Oktober (ECF 679) yang menantang produksi sampel 20 juta log, dan memerintahkan kedua pihak untuk memberikan klarifikasi mengapa mereka tidak setuju.
Pada saat itu, hakim meminta para pihak untuk menjelaskan bagaimana perselisihan tersebut berkaitan dengan kekhawatiran sebelumnya tentang log yang dihapus dan apakah OpenAI telah mengingkari kesepakatan sebelumnya mengenai apa yang sebelumnya mereka klaim akan diserahkan.
Akhir bulan lalu, OpenAI mengajukan keberatan resmi untuk meminta hakim distrik membatalkan perintah penemuan fakta dari hakim magistrate.
Perusahaan berpendapat bahwa putusan tersebut “jelas keliru” dan “tidak proporsional,” karena akan memaksa perusahaan mengungkap jutaan percakapan pengguna privat, menurut dokumen pengadilan yang dibagikan kepada Decrypt oleh perwakilan OpenAI.
Perselisihan ini muncul sebagai bagian dari serangan yang lebih luas terhadap laboratorium AI, dengan penulis, organisasi berita, penerbit musik, dan repositori kode berusaha menguji seberapa jauh hukum hak cipta yang ada berlaku ketika model mengonsumsi dan mereproduksi materi yang dilindungi.
Pengadilan di seluruh AS dan Eropa kini sedang memilah klaim serupa.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
OpenAI Diperintahkan untuk Menyerahkan 20 Juta Log ChatGPT dalam Kasus Hak Cipta NYT
Secara singkat
Pusat Seni, Fashion, dan Hiburan Decrypt.
Temukan SCENE
Seorang hakim federal telah memerintahkan OpenAI untuk menyerahkan sekitar 20 juta log ChatGPT yang telah dianonimkan kepada The New York Times dan penggugat lainnya, semakin memperluas eksposur perusahaan pengembang AI tersebut terhadap berbagai sengketa hak cipta dan tata kelola data.
Dikeluarkan pada hari Rabu di New York, perintah tersebut menolak upaya OpenAI untuk memblokir produksi catatan percakapan pengguna dan mengarahkan perusahaan untuk menyerahkan log tersebut di bawah kerangka perlindungan.
Hasilnya dapat membentuk bagaimana perusahaan teknologi seperti OpenAI, Anthropic, dan Perplexity mendapatkan data pelatihan, melisensikan konten, dan membangun pembatasan atas apa yang dapat dihasilkan sistem mereka.
Meskipun pengadilan “mengakui bahwa pertimbangan privasi pengguna OpenAI adalah tulus,” pertimbangan tersebut “hanya satu faktor dalam analisis proporsionalitas, dan tidak dapat mendominasi ketika terdapat relevansi yang jelas dan beban yang minimal,” tulis Hakim Magistrate AS Ona T. Wang.
Decrypt telah menghubungi kedua pihak untuk memberikan komentar.
Perintah ini berasal dari gugatan yang sedang berlangsung oleh Times, yang menuduh bahwa model OpenAI dilatih menggunakan konten berita yang memiliki hak cipta tanpa izin. Gugatan ini pertama kali diajukan pada Desember 2023.
Pada Januari tahun lalu, OpenAI menantang klaim NYT dan mengajukan gugatan balik, dengan menyatakan bahwa publikasi tersebut tidak “menceritakan seluruh cerita.”
Pengadilan kemudian menemukan bahwa 20 juta sampel log percakapan yang dimaksud adalah “proporsional dengan kebutuhan kasus” untuk menilai apakah output ChatGPT menyalin materi milik NYT.
Selama setahun terakhir, perselisihan semakin memanas, dengan para penggugat mendesak akses luas ke data output, sementara OpenAI memperingatkan bahwa produksi materi secara luas ini akan menimbulkan beban privasi dan operasional.
Pada bulan Juni, OpenAI mengalami kemunduran lain ketika pengadilan memerintahkan perusahaan untuk menyimpan berbagai data pengguna ChatGPT untuk keperluan gugatan, termasuk percakapan yang mungkin sudah dihapus oleh pengguna.
Beberapa bulan kemudian, pada bulan Oktober, perselisihan muncul kembali, dengan pengadilan menyoroti pengajuan OpenAI pada 20 Oktober (ECF 679) yang menantang produksi sampel 20 juta log, dan memerintahkan kedua pihak untuk memberikan klarifikasi mengapa mereka tidak setuju.
Pada saat itu, hakim meminta para pihak untuk menjelaskan bagaimana perselisihan tersebut berkaitan dengan kekhawatiran sebelumnya tentang log yang dihapus dan apakah OpenAI telah mengingkari kesepakatan sebelumnya mengenai apa yang sebelumnya mereka klaim akan diserahkan.
Akhir bulan lalu, OpenAI mengajukan keberatan resmi untuk meminta hakim distrik membatalkan perintah penemuan fakta dari hakim magistrate.
Perusahaan berpendapat bahwa putusan tersebut “jelas keliru” dan “tidak proporsional,” karena akan memaksa perusahaan mengungkap jutaan percakapan pengguna privat, menurut dokumen pengadilan yang dibagikan kepada Decrypt oleh perwakilan OpenAI.
Perselisihan ini muncul sebagai bagian dari serangan yang lebih luas terhadap laboratorium AI, dengan penulis, organisasi berita, penerbit musik, dan repositori kode berusaha menguji seberapa jauh hukum hak cipta yang ada berlaku ketika model mengonsumsi dan mereproduksi materi yang dilindungi.
Pengadilan di seluruh AS dan Eropa kini sedang memilah klaim serupa.