تكساس من خطوتين حول انتهاك بيانات التدريب؟

eilm

0 11 4 دقائق

تكساس من خطوتين حول انتهاك بيانات التدريب؟

“يشير هذا القرار إلى تطور كبير في كيفية إدارة شركات الذكاء الاصطناعي لخطر انتهاك حقوق الطبع والنشر مع الاستمرار في ابتكار وإصدار نماذج جديدة. ومع ذلك ، لم تتناول المحكمة ما إذا كان جمع المواد المحمية بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعي يمكن اعتبارها انتهاكًا “.

إن تقاطع تكنولوجيا الذكاء الاصطناعي (AI) وقانون حقوق الطبع والنشر يضع قوة لا تقاوم ضد إطار قانوني متطور وغير مؤكد. أحدث الحالات صنع الأمواج في هذا الصراع Concord Music Group ، Inc. v. Anthropic PBC، حيث زعمت مجموعة Concord Music Group وغيرها من الناشرين انتهاكًا لحقوق الطبع والنشر من قبل شركة الذكاء الاصطناعى الأنثروبري. تدور إحدى المشكلات الرئيسية في القضية حول ما إذا كانت نماذج الذكاء الاصطناعي للأنثروبور ، وتحديداً نماذج لغتها الكبيرة (LLMS) ، تولد محتوى انتهاكًا لأن النتائج مستمدة من الأعمال المحمية بحقوق الطبع والنشر.

سعى المدعون إلى أمر قضائي أولي ضد الإنسان. وجادلوا أنه بدونها ، سيعاني الناشرون من ضرر لا يمكن إصلاحه بسبب احتمال حدوث انتهاك واسع النطاق الناتج عن المخرجات التي تولدها الذكاء الاصطناعي. وادعوا أن نماذج الذكاء الاصطناعى المدربين على كلمات وتراكيب محمية بحقوق الطبع والنشر يمكن أن تنشئ نصًا يشبه أو يكرر الأعمال المحمية بشكل وثيق ، مما يتيح الاستخدام والتوزيع غير المصرح لهم.

في أمرها الأخير الذي يتبنى تسوية وصلت إليها الأطراف بناءً على اقتراح الناشر ، تناولت المحكمة جانبًا رئيسيًا من طلب الناشرين: ما إذا كان ينبغي أن تكون هناك حاجة إلى أنثروبور للحفاظ على درابزينها الحالية. في هذه الحالة ، تشير “الدرابزين” إلى تدابير وقائية أو ضمانات أن الإنسان قد صمم وتنفيذ لمنع أنظمة الذكاء الاصطناعى من إنتاج الإنتاج الذي ينتهك قوانين حقوق الطبع والنشر. باختصار ، يتم تضمين هذه القواعد أو المرشحات في الذكاء الاصطناعى لمنعها من إنشاء نص قد ينسخ أو إعادة إنتاج أعمال محمية بحقوق الطبع والنشر مثل كلمات الأغاني دون إذن.

الدرابزين

ركز أمر المحكمة على التزام الإنسان المعلن بالحفاظ على هذه الدرابزين. ومع ذلك ، فإن الحكم لا يعالج السؤال الأكبر (وربما أكثر تأثيرًا) حول ما إذا كان استخدام الذكاء الاصطناعي للبيانات المحمية بحقوق الطبع والنشر “بيانات تدريب” لتعلم وتدريب خوارزمياتها ونماذجها قد تكون قضية قانونية.

لاحظت المحكمة أن الأطراف قد توصلت إلى اتفاق يحل على وجه التحديد قضية الدرابزين. بموجب الاتفاقية ، كانت هناك حاجة إلى الأنثروبور لمواصلة استخدام الدرابزين الذي كانت قد نفذته بالفعل في نماذج الذكاء الاصطناعى وعروض المنتجات. يتطلب الشرط أيضًا أن تحتوي أي نماذج من الذكاء الاصطناعى في المستقبل أو تقديم منتجات جديدة على الدرابزين ، وبالتالي ضمان تطبيقها باستمرار.

يشير هذا القرار إلى تطور كبير في كيفية إدارة شركات الذكاء الاصطناعي لخطر انتهاك حقوق الطبع والنشر مع الاستمرار في ابتكار وإصدار نماذج جديدة. ومع ذلك ، لم تتناول المحكمة ما إذا كان جمع المواد المحمية بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعى يمكن اعتبارها انتهاكًا. هذا هو السؤال الحاسم الذي لم تتم الإجابة عليه يبقى في وسط القضية. ركز الترتيب بالكامل على استخدام الدرابزين لمنع الذكاء الاصطناعى من توليد المحتوى المخالف ، مما يترك المسائل الأساسية لجمع البيانات واستخدامها.

الأسئلة التي لم يتم حلها لجمع البيانات لاستخدام التدريب

بينما عالجت المحكمة فعالية الدرابزين ، فإنها لا تحل المسألة الأساسية المتمثلة في ما إذا كان استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب أنظمة الذكاء الاصطناعي يمكن أن يشكل انتهاكًا. يظل هذا السؤال نقطة خلاف في العديد من الحالات المماثلة المعلقة في جميع أنحاء البلاد وهو مشكلة مهمة لمطوري الذكاء الاصطناعى ، وكذلك بالنسبة لأولئك الذين يولدون محتوى باستخدام أنظمة الذكاء الاصطناعى.

يثير استخدام البيانات المحمية بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعي مسألة ما إذا كان هذا التدريب يشكل “الاستخدام العادل” المسموح به بموجب قانون حقوق الطبع والنشر أو ما إذا كان ينتهك حقوق أصحاب حقوق الطبع والنشر. الاستخدام العادل هو عقيدة قانونية تتيح الاستخدام المحدود للمواد المحمية بحقوق الطبع والنشر دون إذن من صاحب الحقوق ، وعادةً ما يكون لأغراض مثل النقد أو التعليق أو التقارير الإخبارية أو التدريس أو المنح الدراسية أو البحث. هذه المشكلة معقدة بشكل خاص عندما يتعلق الأمر بجمع البيانات على نطاق واسع للتدريب ، حيث قد تتضمن البيانات أعمالًا محمية بحقوق الطبع والنشر دون إذن من أصحاب الحقوق.

في حين أن اقتراح الناشرين في أمر قضائي أولي في مجموعة موسيقى كونكورد لم تعالج القضية هذه المشكلة مباشرة ، فمن الواضح أن النقاش حول ما إذا كان تدريب نماذج الذكاء الاصطناعى على البيانات المحمية بحقوق الطبع والنشر يمكن أن يشكل انتهاكًا بعيدًا عن التسوية.

الآثار المترتبة على عقيدة الاستخدام العادل

إن التركيز على الدرابزين بدلاً من جمع البيانات يجلب الآثار المحتملة على عقيدة الاستخدام العادل. يسمح استثناء الاستخدام العادل بموجب قانون حقوق الطبع والنشر في الولايات المتحدة باستخدام بعض الاستخدامات للمواد المحمية بحقوق الطبع والنشر دون إذن ، عادةً عندما يُعتبر الاستخدام تحويليًا أو غير مالي أو مفيد للجمهور. في سياق الذكاء الاصطناعى ، يمكن للمرء أن يجادل بأنه إذا اتخذت شركة مثل الأنثروبور خطوات مهمة لحماية المواد المحمية بحقوق الطبع والنشر من خلال تنفيذ الدرابزين لمنع توليد المحتوى المخالف ، فقد تعزز حالة الاستخدام العادل.

من المحتمل أن يجادل المطورين مثل الأنثروبور بأن خطواتها للتخفيف من الانتهاك من خلال استخدام الدرابزينات تظهر جهد حسن النية لاحترام قوانين حقوق الطبع والنشر. يمكن أن يجعل هذا الموقف الاستباقي حجة الاستخدام العادل أكثر منطقية لأن الشركة تعمل بنشاط لمنع الاستخدام غير القانوني للمحتوى المحمي بحقوق الطبع والنشر في أنظمة AI الخاصة بها. من خلال اتخاذ تدابير لمنع مخرجاتها من الانتهاك ، يمكن للأنثروبور أن يتجاوز المخاوف من أن جمع المواد المحمية بحقوق الطبع والنشر واستخدامها لأغراض التدريب ينتهك قوانين حقوق الطبع والنشر. بدلاً من ذلك ، سوف يزعم أن هذا التجميع واستخدام المواد المحمية بحقوق الطبع والنشر هو جزء من إطار استخدام عادل أوسع.

من ناحية أخرى ، قد يجادل حاملي حقوق الطبع والنشر أنه حتى مع وجود درابزين في مكانها ، فإن استخدام البيانات المحمية بحقوق الطبع والنشر لأغراض التدريب – دون إذن صريح – لا يزال يمثل مخاطر كبيرة من الانتهاك. مع تطور تقنيات الذكاء الاصطناعي ، من المحتمل أن تستمر المحاكم في دراسة هذه القضايا بالتفصيل ، واستكشاف كيفية تطبيق عقيدة الاستخدام العادل في سياق تطوير الذكاء الاصطناعي واستخدامه.

ال Concord Music Group v. Anthropic توفر القضية نظرة مثيرة للاهتمام على التحديات القانونية والأخلاقية المستمرة المحيطة بـ AI وقانون حقوق الطبع والنشر. في حين أن أمر المحكمة على الدرابزين يمثل خطوة نحو التخفيف من خطر انتهاك الناتج الذي تم إنشاؤه من الذكاء الاصطناعى ، فإن مسألة ما إذا كان يمكن اعتبار استخدام البيانات المحمية بحقوق الطبع والنشر لنماذج التدريب انتهاكًا دون إجابة. مع استمرار تطور الذكاء الاصطناعي ، وكذلك المشهد القانوني. يكمن التحدي في كيف يمكن للشركات تسريع ابتكارها على الطريق السريع AI أثناء التنقل في قوانين حركة المرور الفكرية المتطورة ، والتي تتشكل تدريجياً كقضايا تشق طريقها عبر المحاكم.

جوستين دانيلز صورة

جاستن دانيلز

جاستن دانيلز هو مساهم في شركة المحاماة بيكر دونيلسون في أتلانتا. إنه يمثل الشركات المحلية والدولية وأصحاب الأعمال في جميع جوانب دورات النمو ويقدم المشورة […see more]