يعمل الذكاء الاصطناعي التوليدي على توسيع قانون حقوق النشر الحالي بطرق غير متوقعة وغير مريحة. أصدر مكتب حقوق الطبع والنشر الأمريكي مؤخرًا إرشادات تنص على أن مخرجات الذكاء الاصطناعي المولدة للصور ليست محمية بحقوق الطبع والنشر ما لم يذهب الإبداع البشري إلى المطالبات التي أدت إلى توليده. لكن هذا يترك العديد من الأسئلة: ما هو مقدار الإبداع المطلوب، وهل هو نفس النوع من الإبداع الذي يمارسه الفنان باستخدام فرشاة الرسم؟
تتعامل مجموعة أخرى من الحالات مع النص (عادة الروايات والروائيين)، حيث يرى البعض أن تدريب نموذج على مواد محمية بحقوق الطبع والنشر يعد في حد ذاته انتهاكًا لحقوق الطبع والنشر، حتى لو لم يعيد النموذج إنتاج تلك النصوص أبدًا كجزء من مخرجاته. لكن قراءة النصوص كانت جزءًا من عملية التعلم البشري طوال فترة وجود اللغة المكتوبة. بينما ندفع لشراء الكتب، فإننا لا ندفع لنتعلم منها.
كيف نفهم هذا؟ ماذا يعني قانون حقوق النشر في عصر الذكاء الاصطناعي؟ يقدم التقني جارون لانيير إجابة واحدة من خلال فكرته عن كرامة البيانات، والتي تميز ضمنيًا بين تدريب (أو “تدريس”) نموذج وتوليد المخرجات باستخدام النموذج. ويرى لانير أن النشاط الأول يجب أن يكون محميًا، في حين أن الإنتاج قد ينتهك بالفعل حقوق الطبع والنشر لشخص ما.
وهذا التمييز جذاب لعدة أسباب. فأولا، يحمي قانون حقوق الطبع والنشر الحالي “الاستخدامات التحويلية… التي تضيف شيئا جديدا”، ومن الواضح تماما أن هذا هو ما تفعله نماذج الذكاء الاصطناعي. علاوة على ذلك، لا يبدو الأمر كما لو أن نماذج اللغات الكبيرة مثل ChatGPT تحتوي على النص الكامل لروايات جورج آر آر مارتن الخيالية، على سبيل المثال، والتي ينسخون ويلصقون منها بوقاحة.
بل إن النموذج عبارة عن مجموعة هائلة من المعلمات ــ استنادا إلى كل المحتوى الذي تم استيعابه أثناء التدريب ــ والتي تمثل احتمالية أن تتبع كلمة واحدة كلمة أخرى. عندما تصدر هذه المحركات الاحتمالية سوناتة شكسبيرية لم يكتبها شكسبير أبدًا، فهذا يعد تحويلًا، حتى لو لم تكن السوناتة الجديدة جيدة على الإطلاق.
يرى لانير أن إنشاء نموذج أفضل هو منفعة عامة تخدم الجميع ــ حتى المؤلفين الذين تُستخدم أعمالهم لتدريب هذا النموذج. وهذا يجعلها تحويلية وتستحق الحماية. ولكن هناك مشكلة في مفهومه لكرامة البيانات (وهو ما يعترف به تماما): فمن المستحيل التمييز بشكل هادف بين “تدريب” نماذج الذكاء الاصطناعي الحالية و”توليد المخرجات” بأسلوب الروائية جيسمين وارد على سبيل المثال.
يقوم مطورو الذكاء الاصطناعي بتدريب النماذج من خلال منحهم أجزاء أصغر من المدخلات ومطالبتهم بالتنبؤ بالكلمة التالية مليارات المرات، مع تعديل المعلمات قليلاً على طول الطريق لتحسين التوقعات. ولكن يتم بعد ذلك استخدام نفس العملية لتوليد المخرجات، وهنا تكمن المشكلة من وجهة نظر حقوق الطبع والنشر.
قد يبدأ النموذج الذي يُطلب منه الكتابة مثل شكسبير بكلمة “إلى”، مما يزيد احتمالية أن يتبعها بكلمة “be”، مما يزيد احتمالية أن تكون الكلمة التالية “أو” – وهكذا إيابا. ومع ذلك، يظل من المستحيل ربط هذا الناتج مرة أخرى ببيانات التدريب.
من أين جاءت كلمة “أو”؟ في حين أنها الكلمة التالية في مناجاة هاملت الشهيرة، إلا أن العارضة لم تكن تقلد هاملت. لقد اختار ببساطة “أو” من بين مئات الآلاف من الكلمات التي كان بإمكانه اختيارها، وكل ذلك بناءً على الإحصائيات. هذا ليس ما نعتبره نحن البشر إبداعًا. يعمل هذا النموذج ببساطة على تعظيم احتمالية أن نجد نحن البشر نتائجه واضحة.
ولكن كيف يمكن إذًا تعويض المؤلفين عن أعمالهم عندما يكون ذلك مناسبًا؟ على الرغم من أنه قد لا يكون من الممكن تتبع المصدر باستخدام روبوتات الدردشة التوليدية الحالية المعتمدة على الذكاء الاصطناعي، إلا أن هذه ليست نهاية القصة. في العام أو نحو ذلك منذ إصدار ChatGPT، قام المطورون ببناء تطبيقات فوق نماذج الأساس الموجودة. يستخدم الكثيرون تقنية الاسترجاع المعزز (RAG) للسماح للذكاء الاصطناعي “بالتعرف على” المحتوى غير الموجود في بيانات التدريب الخاصة به. إذا كنت بحاجة إلى إنشاء نص لكتالوج المنتجات، فيمكنك تحميل بيانات شركتك ثم إرسالها إلى نموذج الذكاء الاصطناعي مع التعليمات: “استخدم فقط البيانات المضمنة في هذه المطالبة في الرد”.
على الرغم من أن RAG تم تصميمه كطريقة لاستخدام معلومات الملكية دون المرور بعملية التدريب كثيفة العمالة والحوسبة، إلا أنه ينشئ أيضًا بالمصادفة اتصالاً بين استجابة النموذج والمستندات التي تم إنشاء الاستجابة منها. وهذا يعني أن لدينا الآن مصدرًا، مما يقربنا كثيرًا من تحقيق رؤية لانير لكرامة البيانات.
إذا قمنا بنشر برنامج تحويل العملات الخاص بمبرمج بشري في كتاب، وقام نموذجنا اللغوي بإعادة إنتاجه ردًا على سؤال، فيمكننا أن نعزو ذلك إلى المصدر الأصلي وتخصيص الإتاوات بشكل مناسب. وينطبق الشيء نفسه على رواية تم إنشاؤها بواسطة الذكاء الاصطناعي ومكتوبة بأسلوب وارد (الممتاز) Sing، Unburied، Sing.
تُعد ميزة “النظرة العامة المدعومة بالذكاء الاصطناعي” من Google مثالًا جيدًا لما يمكن أن نتوقعه مع RAG. نظرًا لأن Google تمتلك بالفعل أفضل محرك بحث في العالم، فيجب أن يكون محرك التلخيص الخاص بها قادرًا على الاستجابة للمطالبة عن طريق إجراء بحث وإدخال أفضل النتائج في LLM لإنشاء نظرة عامة يطلبها المستخدمون. سيوفر النموذج اللغة والقواعد، لكنه سيستمد المحتوى من المستندات المضمنة في الموجه. مرة أخرى، هذا من شأنه أن يوفر المصدر المفقود.
والآن بعد أن علمنا أنه من الممكن إنتاج مخرجات تحترم حقوق الطبع والنشر وتعوض المؤلفين، يتعين على الجهات التنظيمية أن تكثف جهودها لتحميل الشركات المسؤولية عن فشلها في القيام بذلك، تماما كما تتحمل المسؤولية عن خطاب الكراهية وغيره من أشكال المحتوى غير اللائق. لا ينبغي لنا أن نقبل ادعاء كبار مقدمي خدمات LLM بأن المهمة مستحيلة من الناحية الفنية. وفي الواقع، فهو يمثل تحديًا آخر من التحديات العديدة المتعلقة بنماذج الأعمال والتحديات الأخلاقية التي يمكنهم، بل يتعين عليهم، التغلب عليها.
علاوة على ذلك، يقدم RAG أيضًا حلاً جزئيًا على الأقل لمشكلة “الهلوسة” الحالية الخاصة بالذكاء الاصطناعي. إذا قام أحد التطبيقات (مثل بحث جوجل) بتزويد نموذج بالبيانات اللازمة لبناء الاستجابة، فإن احتمالية توليد شيء خاطئ تمامًا أقل بكثير مما لو كان يعتمد فقط على بيانات التدريب الخاصة به. وبالتالي يمكن جعل مخرجات الذكاء الاصطناعي أكثر دقة إذا اقتصرت على المصادر المعروفة بأنها موثوقة.
لقد بدأنا للتو في رؤية ما هو ممكن مع هذا النهج. ستصبح تطبيقات RAG بلا شك أكثر تعقيدًا وطبقات. ولكن الآن بعد أن أصبح لدينا الأدوات اللازمة لتتبع المصدر، لم يعد لدى شركات التكنولوجيا عذر لعدم مساءلة حقوق النشر. — نقابة المشروع
مايك لوكيدس، نائب رئيس إستراتيجية المحتوى في شركة O’Reilly Media, Inc.، هو مؤلف كتاب System Performance Tuning (O’Reilly Media, Inc., 2002) ومؤلف مشارك لـ Unix Power Tools (O’Reilly Media, Inc., 2002) والأخلاقيات وعلوم البيانات (O’Reilly Media, Inc., 2018). تيم أورايلي، المؤسس والرئيس التنفيذي لشركة O’Reilly Media، Inc.، وهو أستاذ زائر في معهد كلية لندن الجامعية للابتكار والغرض العام ومؤلف كتاب WTF؟ ما هو المستقبل ولماذا يعود الأمر إلينا (هاربر بيزنس، 2017).