Connect with us

Hi, what are you looking for?

اقتصاد

من البرمجة إلى المحادثة: هل يستطيع الذكاء الاصطناعي تعليم الروبوتات اللغة العربية؟ – أخبار

كان حبش سابقًا عالم أبحاث في مركز أنظمة التعلم الحاسوبية بجامعة كولومبيا قبل انضمامه إلى جامعة نيويورك أبوظبي

في عالم يعتمد بشكل متزايد على الذكاء الاصطناعي (AI) والنطاق الهائل من البيانات الرقمية، يقف نزار حبش، عالم الكمبيوتر المتخصص في معالجة اللغات الطبيعية واللغويات الحاسوبية، عند مفترق طرق فريد من نوعه. مع ظهور أنظمة الذكاء الاصطناعي المتقدمة مثل ChatGPT التي تمتلك القدرة على تغيير عالمنا بالكامل، من المهم ملاحظة أن غالبية هذه المنصات تعمل بشكل أساسي باللغة الإنجليزية. مع لغات أخرى مثل اللغة العربية يمكن أن تواجه انتكاسات بسبب محدودية البيانات عبر الإنترنت. من خلال أبحاث مكثفة تمتد عبر الترجمة الآلية، والتحليل الصرفي، والنمذجة الحسابية للغة العربية ولهجاتها، تقدم أبحاث حبش رؤى حول التحديات والفرص التي يوفرها بناء أنظمة الذكاء الاصطناعي باللغة العربية، أو بعبارات أبسط، “تعليم اللغة العربية للروبوتات، “يمزح.

ويشير حبش، أستاذ علوم الكمبيوتر في جامعة نيويورك أبوظبي، إلى الحاجة الملحة لتطوير أنظمة تعلم آلي أكثر تطوراً ومجهزة بشكل أفضل لمعالجة الفروق الثقافية الدقيقة المضمنة في اللغات المختلفة. “اللغة العربية هي إحدى أهم اللغات على مستوى العالم. وهي تحتل المرتبة الأولى من حيث عدد الأشخاص الذين يستخدمونها، سواء للحياة اليومية أو للأغراض الدينية فقط. يقول حبش: “إنها لغة مهمة حملت المعرفة على مدى فترة طويلة من تاريخ البشرية، وحافظت عليها بشكل أساسي”. “اليوم، عندما نقوم بتقييم الموارد المتاحة للغة العربية وأنظمة الذكاء الاصطناعي المستخدمة حاليًا، نجد أنها لا تتناسب مع مستوى التعقيد الذي تحمله اللغة.”

يقول حبش، الذي ينحدر في الأصل من فلسطين: “كوني متحدثًا أصليًا للغة العربية، فقد كنت على دراية بتعقيداتها منذ سن مبكرة جدًا – بدءًا من لهجاتها المختلفة في جميع أنحاء العالم العربي وحتى المعايير التي كان علي الالتزام بها طوال حياتي”. تعليم. لقد فكرت كثيرًا في كيفية استخدام اللغة العربية كوسيلة لهويتنا ومعرفتنا وتواصلنا، خاصة في عصر الذكاء الاصطناعي. ونحن نواجه أمثلة عديدة للمشاكل في هذا الصدد.

تحديات البيانات

هل يمكن للقيود المفروضة على البيانات المتاحة عبر الإنترنت لتعلم اللغة العربية أن تؤثر على تطوير وأداء أنظمة الذكاء الاصطناعي؟ ووفقاً لحباش، فإن الدفعة الحالية في مجال الذكاء الاصطناعي والتي حققت نجاحاً كبيراً هي “ببساطة أن المزيد من البيانات هو الأفضل”. “هذا ليس التحدي الأكبر، ولكن بالنسبة لبعض الناس، قد ينظر إليه على أنه التحدي الوحيد. المشكلة هي أنك ستصل إلى النقطة التي لا يوجد فيها المزيد من البيانات التي يتم إنشاؤها بشكل طبيعي، وفي اللحظة التي نبدأ فيها في توليد بيانات اصطناعية وتدريب أنظمة الذكاء الاصطناعي على ذلك، فإن الأمر يشبه إنشاء الوحوش،” كما يقول حبش، وهو عالم أبحاث سابق في جامعة كولومبيا. مركز أنظمة التعلم الحاسوبية.

ويوضح أن الذكاء الاصطناعي يستخدم حلقات ردود الفعل، والتي يمكن أن تتضمن مدخلات تحتوي على أخطاء “إبداعية”. لإنتاج 100 ضعف كمية البيانات، يعني أنه سيتم تضخيم الأخطاء أيضًا 100 مرة. يقول حبش: “عندما تتكرر الأخطاء مراراً وتكراراً، تصبح هي القاعدة، ويمكن أن تصبح القاعدة هي النموذج التشغيلي”. “النموذج ليس لديه مفهوم للواقع. إنها ببساطة تحاول التنبؤ بالكلمة التالية، أو ملء الفراغ، أو استخدام ما يسمى تقنيات الإخفاء لمعرفة الجزء التالي من الجملة. الذكاء الاصطناعي رائع في ارتكاب الأخطاء بثقة.

عند مناقشة القيود المفروضة على جمع البيانات عبر الإنترنت باللغة العربية، يسلط حبش الضوء على مخاطر التحيز الخوارزمي والفروق الدقيقة الكامنة في النص العربي، مثل غياب علامات التشكيل في الاستخدام الشائع. تشكل هذه التعقيدات تحديات هائلة لأنظمة الذكاء الاصطناعي التي تسعى جاهدة إلى فهم النص العربي ومعالجته بدقة. “اللغة العربية، في الاستخدام الشائع عادةً، تُكتب بدون علامات التشكيل التي تشير إلى حروف العلة. فقط حوالي 1 إلى 2% من الكلمات العربية في الصحف تحتوي فعليًا على علامة لحروف العلة، لكن القراء العرب يعرفون كيفية فهمها. ومع ذلك، قد تكون الكلمة غامضة نتيجة لذلك ويمكن أن يكون لها معاني كثيرة. ويضيف: “لذا، عندما نقوم بتعليم الآلات، يصبح السياق مهمًا حقًا”.

للغة العربية أيضًا لهجات عديدة، وحيث توجد لهجات، توجد اختلافات تاريخية. “تُكتب اللغة العربية الفصحى، لغة القرآن، بطرق مختلفة قليلاً عن اللغة العربية الفصحى الحديثة. وهذا شيء آخر تتعامل معه الآلات. يقول حبش: “يمكن أن يخلط نص القرآن مع اللغة العربية الفصحى الحديثة، مع اللهجة المصرية، ويجمع هذه الكومة معًا، الأمر الذي من شأنه أن يربك الكثير من الأشياء”. “هناك تعقيدات مختلفة. في رأيي، بعض التحديات المثيرة للاهتمام التي لم يتم استغلالها بعد، من المحتمل أن تكون ذات صلة بالتحيز الخوارزمي.

الحساسية الثقافية والتحيزات

ما هي الخطوات التي ينبغي اتخاذها لضمان أن تكون أنظمة الذكاء الاصطناعي باللغة العربية حساسة ثقافياً وتتجنب التحيز في تفاعلاتها؟ «هناك أنواع مختلفة من التحيزات؛ أحدهما هو تحيز المحتوى، والآخر هو تحيز الشكل النحوي. يقول حبش: “كلاهما مترابطان”. “يرتبط تحيز المحتوى بنوع الأفكار حول العالم التي من المحتمل أن يولدها النظام في النماذج التوليدية. وكما قال عالم الذكاء الاصطناعي توبي والش سابقًا، “اللغة سياسية”. هناك دائمًا تحيز مضمن. إلى حد ما، وأنا أتفق مع هذا. على سبيل المثال، في التقارير الصحفية التقليدية، كنا نرى دائمًا نموذج القتل، حيث يبدو أن الإسرائيليين “يقتلون” دائمًا والفلسطينيون “يموتون” دائمًا – من المستحيل أن نقتل. هذه الأنواع من التحيزات يمكن أن تحدث أيضًا في اللغة العربية.

ويضيف مستشهدًا بمثال أحدث من قيام ChatGPT بجولات على وسائل التواصل الاجتماعي، “وبالمثل، سُئل ChatGPT: “هل يستحق الفلسطينيون أن يكونوا أحرارًا؟” و”هل يستحق الإسرائيليون أن يكونوا أحراراً؟” كان الجواب بالنسبة للإسرائيليين يتعلق بما يلي: “بالطبع، الإسرائيليون بشر، وجميع البشر يستحقون الحرية”، بينما بالنسبة للفلسطينيين، كان الرد على غرار “إن مسألة كون الفلسطينيين أحرارًا هي مسألة معقدة ذات معنى”. آراء كثيرة”. هناك تحيزات في كل مكان. يقول حبش: “سوف يكرر الذكاء الاصطناعي ما يتعلمه”.

ومع ذلك، على الرغم من أن التحيز الخوارزمي ينبع من التحيز البشري، فإن حلقة ردود الفعل التي تعمل ضمنها أنظمة التعلم الآلي قد تؤدي إلى تضخيم التحيز، الأمر الذي يمكن أن يكون مدعاة للقلق. يقول حبش: “إن التحدي الحقيقي هو معرفة كيفية جعل الآلات تصمم بشكل صحيح، ومعرفة الأشياء التي يجب أن تحظى بوزن أعلى أو معدل أقل”.

ويضيف أن الحلول المحتملة لمحاربة التحيز الخوارزمي الحالي تشمل إما إضافة المزيد من البيانات إلى المزيج، أو أن يعمل الباحثون على تحديد المحتوى الذي يبدو مختلفًا عن التوزيع الطبيعي. “على سبيل المثال، إذا كان هناك الكثير من الإشارات إلى أن الأطباء رجال والممرضات نساء، فهل يمكنك بالفعل تقليل أوزان النموذج بشكل مصطنع؟ ليس عليك تغيير البيانات؛ يمكنك تغيير الطريقة التي تتعلم بها من البيانات. يقول حبش: “إذا رأينا نمطًا يبدو غريبًا نوعًا ما، فيمكننا العمل على موازنته”. “إنها حقًا مساحة جديدة ومثيرة لأننا نتعامل مع البيانات والمعلومات ويمكن التلاعب بها بطرق مختلفة.”

دور خبراء اللغة والذكاء الاصطناعي

إذن، ما هي الطرق التي يمكن لخبراء اللغة الحاسوبية، مثل حبش، المساهمة في التغلب على هذه التحديات لاتخاذ خيارات تصميمية “أفضل”؟ “هذا سؤال عظيم. يقول حبش: “كصناعة، نحن نركز بشكل أكبر على كفاءة وفعالية وتصميم النموذج، وخلق شيء بسيط وسهل مع نوع من “أناقة Google”. “لقد قامت Google بتبسيط كل شيء من خلال مربع بحث واحد بسيط وهو أمر جذاب جدًا للأشخاص المنشغلين بالفعل. كمية البيانات الموجودة على الويب ضخمة جدًا بشكل يبعث على السخرية. الجميع يريد الإجابة المختصرة.”

وفي مجال خيارات التصميم لنماذج الذكاء الاصطناعي، يدعو حبش إلى البساطة دون التضحية بالمضمون، محذرًا من “الطلاقة الخادعة”. “على سبيل المثال، إذا كنت تتحدث إلى متحدث باللغة الإنجليزية يتمتع بنطق جيد، فيمكنك فهمه ومتابعة ما يتحدث عنه، وافتراضك الأساسي هو أن هذا الشخص يبدو جيدًا للأذن، وأنا أفهمه أو أفهمها. من الواضح أنهم أذكياء، إذا كانوا أذكياء، فهم جيدون، وإذا كانوا جيدين، فإنهم يقولون الحقيقة”.

“ولكن إذا كان هناك شخص فائق الذكاء يعرف الكثير ولكن لديه صعوبة في التحدث باللغة الإنجليزية، فقد لا تفكر بنفس الطريقة، على الرغم من أنه قد يمنحك جواهر من الحكمة. إنه نفس الشيء مع الآلات. الطلاقة تساوي الذكاء ويوضح قائلاً: “يعادل الحقيقة، وهو أمر غير صحيح منطقياً. نحن لا نتعامل مع شيء لم نتعامل معه من قبل، ولكن الشيء الوحيد هو أن الحجم وإمكانية الوصول إليه أعلى بكثير”.

إن مخاطر التخلي عن الفاعلية البشرية لصالح الذكاء الاصطناعي شديدة الانحدار. “إذا اعتمدنا كثيرًا على الذكاء الاصطناعي لاتخاذ القرارات نيابة عنا ولكي نكون صوتنا، فإننا نتخلى عن شيء ما في إنسانيتنا وذكائنا وضميرنا، وربما مسؤوليتنا، وهو ما لن يأخذنا بعيدًا”. يقول حبش، محذرًا بشدة من الاعتماد الأعمى على أنظمة الذكاء الاصطناعي، مشددًا على الدور الذي لا يمكن استبداله للحكم البشري والتعاطف والمسؤولية الأخلاقية. “لهذا السبب أعتقد أنه من المهم للغاية الاستمرار في تثقيف البشر.”

[email protected]

اضف تعليقك

اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

اخر الاخبار

واشنطن- قالت وزارة الدفاع الأميركية (البنتاغون) يوم الاثنين إن الولايات المتحدة سترسل عددا صغيرا من القوات الإضافية إلى الشرق الأوسط نظرا للتوتر المتزايد بين...

الخليج

الصورة: ADQ/X أعلنت شركة ADQ الاستثمارية التي تتخذ من أبوظبي مقراً لها، اليوم الثلاثاء، أنها ستتعاون مع المركز الدولي للزراعة الملحية (إكبا) وشركة الأغذية...

دولي

منظر عام لميناء حيفا في إسرائيل. صورة أرشيفية من رويترز قالت السلطات الإسرائيلية يوم الثلاثاء إن موانئ إسرائيل في مدينة حيفا بشمال البلاد تعمل...

اقتصاد

يظهر شعار جوجل خارج مرافق جوجل باي فيو في ماونتن فيو، كاليفورنيا. — ملف رويترز تعمل شركة جوجل التابعة لشركة Alphabet على توفير قدرات...

رياضة

مارك أوميرا يلتقط صورة مع إبريق قهوة دلة بعد فوزه ببطولة دبي ديزرت كلاسيك عام 2004. – الصورة مقدمة في عام 2004، كان عالم...

منوعات

يقدم مجموعة مختارة من أفضل منتجات البقالة في المملكة المتحدة أعلنت شركة شويترامز، وهي علامة تجارية موثوقة في مجال تجارة التجزئة للمواد الغذائية، عن...

اخر الاخبار

بيروت – ستظل المدارس والجامعات في لبنان مغلقة حتى يوم الجمعة مع لجوء عشرات الآلاف من السكان النازحين إلى المدارس في مختلف أنحاء البلاد....

اخر الاخبار

الأمم المتحدة – وطالب مسؤولون بارزون في الأمم المتحدة يوم الاثنين “بإنهاء المعاناة الإنسانية المروعة والكارثة الإنسانية” في قطاع غزة بعد مرور ما يقرب...