فريدا هو اختصار لمبادرة الإطار والروبوتات لتطوير الفنون ، على الرغم من أن الباحثين اختاروا الاختصار ، مستوحى من فريدا كاهلو ، قبل أن يقرروا ما تمثله.
فريدا ، ذراع آلية بمساعدة الذكاء الاصطناعي ، تعمل في مجموعة روبوت إنتليجنس في جامعة كارنيجي ميلون في بيتسبرغ ، في 7 أبريل 2023. (كريستيان ثاكر / نيويورك تايمز)
في أحد الأيام مؤخرًا ، على طاولة في مختبر جين أوه في حي سكويرل هيل في بيتسبرغ ، كان ذراع الروبوت مشغولًا بلوحة قماشية. ببطء ، كما لو كان الهواء لزجًا ، غمس الفرشاة في مجموعة من الطلاء الرمادي الفاتح على لوحة ، وتأرجح حوله وضرب القماش ، تاركًا علامة طولها بوصة وسط مجموعة من ضربات الفرشاة الأخرى. ثم تراجعت وتوقفت وكأنها تقيم عملها.
السكتات الدماغية ، ومعظمها ظلال مختلفة من اللون الرمادي ، اقترحت شيئًا مجردًا – ربما عش النمل. أوه ، رئيس مجموعة روبوت إنتليجنس في جامعة كارنيجي ميلون ، مرتديًا قميصًا من النوع الثقيل يحمل عبارة “هناك فنانين بيننا” ، نظر بموافقة. وقفت بجانبها طالب الدكتوراه بيتر شلدنبراند.
غالبًا ما يتطرق عمل أوه ، الذي يتضمن رؤية الروبوت وموضوعات في الطيران المستقل ، إلى ما يُعرف بالفجوة المحاكية إلى الواقعية: كيف يمكن للآلات المدربة في بيئة محاكاة أن تعمل في العالم الحقيقي. في السنوات الأخيرة ، قاد Schaldenbrand جهدًا لسد فجوة sim-to-real بين برامج إنشاء الصور المعقدة مثل Stable Diffusion والأعمال الفنية المادية مثل الرسومات واللوحات. وقد ظهر هذا بشكل أساسي في المشروع المعروف باسم فريدا ، والذي كان أحدث تكراره له طنينًا إيقاعيًا بعيدًا في أحد أركان المختبر. (فريدا هو اختصار لمبادرة الإطار والروبوتات لتطوير الفنون ، على الرغم من أن الباحثين اختاروا الاختصار ، مستوحى من فريدا كاهلو ، قبل أن يقرروا ما تمثله).
يمكن أن تكون عملية الانتقال من مطالبات اللغة إلى الصور المنقطة إلى ضربات الفرشاة معقدة ، حيث يجب أن يكون الروبوت مسؤولاً عن “ضجيج العالم الحقيقي” ، على حد قول أوه. لكنها وشالدينبراند وجيم ماكان ، عالم الروبوتات في كارنيجي ميلون الذي ساعد أيضًا في تطوير فريدا ، يعتقدون أن البحث يستحق المتابعة لسببين: يمكن أن يحسن التفاعل بين البشر والآلات ، ويمكن أن يساعد ، من خلال الفن ، في ربط الناس لبعضهم البعض.
قال ماكان: “يتم تدريب هذه النماذج بناءً على بيانات الجميع” ، مشيرًا إلى نماذج اللغات الكبيرة التي توفرها أدوات التشغيل مثل ChatGPT و DALL-E. “ولذا ما زلت أعتقد أننا نفهم كيف يمكن لمشاريع مثل هذه ، والتي تستخدم مثل هذه النماذج ، أن تقدم قيمة إلى الناس.”
توفر فجوة سيم إلى حقيقية مشكلة صعبة بشكل مدهش لعلماء الروبوتات ومهندسي الكمبيوتر. يمكن لبعض أنظمة الذكاء الاصطناعي أن تسرد الخطوات المتضمنة في المشي (شد عضلات الفخذ الخاصة بك وثني عظم الظنبوب الخلفي ، وإمالة وزنك للخلف وشد الألوية الكبيرة) ويمكنها محاكاة المشي بجسمك في عالم افتراضي. لذلك ، من المغري التفكير في أن هذه الأنظمة يمكن أن تجعل الجسم المادي يمشي بسهولة في العالم الحقيقي.
ليس كذلك. في الثمانينيات ، لاحظ عالم الكمبيوتر هانز مورافيك أن الذكاء الاصطناعي كان جيدًا في الانخراط في التفكير المعقد وتحليل كميات هائلة من البيانات ، لكنه كان سيئًا في الأنشطة البدنية البسيطة ، مثل التقاط زجاجة ماء. يُعرف هذا بمفارقة مورافيك. (يمكن تفسير التفوق الجسدي للبشر من خلال التاريخ التطوري الطويل لأجسامنا ؛ المهام البسيطة بالنسبة لنا مدعومة بملايين السنين من التجارب الداروينية).
الرسم ، الذي يخلط غالبًا بين الأفكار ذات المفاهيم العالية والإجراءات الجسدية الأساسية ، يلقي التناقض في الارتياح: كيف ننجح في التقاط عبثية الوعي البشري بحركات الذراع؟
يتم تدريب أدوات إنشاء الصور بالذكاء الاصطناعي مثل Midjourney و DALL-E و Stable Diffusion عن طريق تغذية الشبكات العصبية بقواعد بيانات ضخمة من الصور والأوصاف النصية المقابلة. الهدف المبرمج هو نمذجة العلاقات بين معاني الكلمات وخصائص الصور ، ثم استخدام هذه العلاقات في “نموذج الانتشار” لإنشاء صور أصلية تحافظ على معنى أوصاف معينة. (ستؤدي المطالبة “نزهة عائلية في المتنزه” إلى إنشاء صورة جديدة في كل مرة يتم استخدامها ؛ وسيكون كل واحد مفهومًا كنزهة عائلية في المتنزه.)
لكن مثل هذه الصور موجودة فقط في عالم المحاكاة الحاسوبية الخاص بأجهزة الكمبيوتر ، التي تتكون من وحدات بكسل متفاوتة الألوان والشدة. اترك المحاكاة وتبقى الصورة في الخلف.
لحل هذه المشكلة ، أخذت أوه وزملاؤها في الحسبان جسدية فريدا. يوجد قطعة من الورق مثبتة على الحائط في معملهم بها 130 ضربة فرشاة مختلفة باللون الأسود: خطوط منحنية وخطوط ، بعضها طويل ومستقيم ، وبعضها أكثر بقليل من النقاط. تمثل العلامات نطاق حركة الروبوت ، وقد تمت برمجتها في نموذج الانتشار الخاص به.
طور الباحثون طريقة للروبوت للرجوع من حين لآخر عن رسمه ، لقياس مدى قربه من الهدف الذي أنشأه بالبكسل ، ثم مراجعة هذا الهدف المنقسم. يمكن أن تكون العلامة الضالة هي حركة راقصة الباليه الضفدع ، أو الحاجب المرتفع لشخص ما من بين جمهورها. لذلك ، كل بضع عشرات من ضربات الفرشاة ، كانت فريدا تبتعد عن اللوحة ، وتلتقط صورة لعملها حتى الآن ، وتتوقف مؤقتًا ثم تعود إلى العمل.
قال أوه ، “ربما هذا هو كيف يمكن للفنانين البشر القيام بذلك”. “أضف بعض ضربات الفرشاة ، ثم عد للخلف وانظر إلى اللوحة الكاملة وأعد الرسم. أردنا تقليد هذه العملية “. عملية اكتشاف الذات الفني ، بطريقة ما ، وإن كانت آلية وخوارزمية وإحصائية.
يتم عرض نتائج هذه الطرق في المختبر. صور أساتذة ، وشخصيات تاريخية ، ومناظر طبيعية ، ومناظر المدينة ، وراقصة الباليه ، كلها بأسلوب تجريدي مميز – حتى صورة ذاتية لأول روبوت فريد من نوعه. يشير تناسق اللوحات إلى رؤية فنية موحدة ، والتي يرفض كل من شالدينبراند وماكان وأوه المطالبة بها. ينسبون كل عمل إلى فريدا.
ولكن هل يمكن أن يكون لدى فريدا عمل بدون إرادة أو قلب أو أظافر؟ هل يمكن للروبوت أن يكون فنانًا؟
قالت إيمي لافييرز ، عالمة الكمبيوتر والراقصة التي تدير معمل الروبوتات والأتمتة والرقص ، وهي منظمة غير ربحية مستقلة ، إن مثل هذه الأسئلة لن تبدو مجنونة أو مخيفة ، إذا كان الناس منفتحين على إلغاء التمييز الصعب بين الفنان والأدب. واسطة. كل شيء – سواء كان ألوانًا مائية أو مولدات صور AI أو رغبة في التعبير – يتم لفه في الفن. حتى شيء بسيط مثل الطلاء يمكن أن يبدو أنه يمتلك عقلًا خاصًا به ، وعلى الرسام أن يتفاعل مع الطريقة التي ينزلق بها على القماش. اقترح لافيرز النظر إلى فريدا على أنها “فرشاة رسم آلية” بدلاً من روبوت للرسم.
قالت: “هناك أشياء يمكنك فعلها بأجسام اصطناعية لا يستطيع البشر فعلها”. “إنه يوسع لوحة التعبير البشري.”
ظهر هذا المقال في الأصل في صحيفة نيويورك تايمز