يقول جوكول كارثيك كومار إن خبرته في جامعة محمد بن زايد للذكاء الاصطناعي قد أعدته جيدًا للعمل في مجال أبحاث الذكاء الاصطناعي وتطويره.
الصورة المرفقة
يعد اكتشاف خطاب الكراهية في الميمات ، وإنشاء منصة دبلجة تفاعلية من الذكاء الاصطناعي والإنسان ، وإجراء أبحاث حول أنظمة تحويل النص إلى كلام القائمة على التعلم العميق في 13 لغة هندية ، بعضًا من المشاريع الرائعة لخريج جامعة محمد بن زايد للاصطناعية. المخابرات (MBZUAI).
قبل بدء التدريبات يوم الأحد ، تحدث جوكول كارثيك كومار ، طالب ماجستير في رؤية الكمبيوتر ، إلى خليج تايمز عن رحلته في المؤسسة الرائدة.
قال إن الجامعة منحته حرية استكشاف العديد من مجالات الذكاء الاصطناعي ، بما في ذلك شغفه بمعالجة اللغة الطبيعية.
“بينما كان تخصصي لمدة عامين في رؤية الكمبيوتر ، فقد دعمني مشرفي في متابعة مشاريع في مجالات أخرى مثل معالجة اللغة الطبيعية ومعالجة الكلام ، والتي كانت مُرضية للغاية وساعدتني في تحديد المجالات التي أنا متحمس لها حاليًا. “
أكد كومار ، المولود في ولاية تاميل نادو الهندية ، أن تجربته في MBZUAI كانت “تحويلية” وأعدته جيدًا لمهنة مستقبلية في مجال البحث والتطوير في مجال الذكاء الاصطناعي.
“لقد تعلمت من بعض الأساتذة الأكثر خبرة في مجال الذكاء الاصطناعي. لقد عززت أيضًا مهاراتي البحثية من تحديد المشكلة إلى اقتراح البحث إلى العرض التقديمي. “
حلول الذكاء الاصطناعي الفريدة
يتمتع Kumar بخلفية واسعة في التعلم الآلي عبر النصوص ، والصور ، والكلام ، والسلاسل الزمنية ، حيث عمل مع أفضل المؤسسات التكنولوجية مثل Microsoft Research India ، و TCS Research ، و MBZUAI ، و IIT Madras. لقد فاز بالعديد من الهاكاثونات ، بما في ذلك IEEE SLT 2022 International hackathon في قطر ، بالإضافة إلى ثمانية هاكاثون على المستوى الوطني في الإمارات العربية المتحدة والهند ، وبراءة اختراع أمريكية.
شارك في تأليف المقالات التي تم نشرها في مؤتمرات رئيسية مثل مؤتمر IEEE الدولي حول الصوتيات والكلام ومعالجة الإشارات (ICASSP 2023) ، ورشة عمل جمعية اللغويات الحاسوبية (ACL 2022) ، الأساليب التجريبية في معالجة اللغة الطبيعية (EMNLP 2022) ورشة عمل ، والمؤتمر الدولي المشترك حول الشبكات العصبية (IJCNN).
بعد حفل البدء ، سوف يسافر إلى اليونان لحضور ICASSP 2023 ، حيث سيقدم ورقة بحثية بعنوان نحو بناء أنظمة تحويل النص إلى كلام لمليار مستخدم قادم.
“بدأ هذا المشروع خلال فترة تدريبي الصيفي في Microsoft Research India ، حيث تعاونت مع مؤلفي المشارك ، Praveen من IIT Madras. تضمن عملنا تقييمًا منهجيًا لخيارات التصميم لأنظمة تحويل النص إلى كلام ، مما أدى إلى إصدار أحدث النماذج لـ 13 لغة هندية. يتوفر معظم برنامج تحويل النص إلى كلام مفتوح المصدر باللغة الإنجليزية ، ولكن توسيعه ليشمل اللغات المحلية يمكن أن يصل إلى الجماهير ، وخاصة الأشخاص الذين لا يعرفون كيفية القراءة “.
الميمات الكارهة ، Autodub
يستكشف بحث أطروحة كومار طرق التمثيل الفعالة للبيانات متعددة اللغات والوسائط. يتناول عمله المهام الحاسمة مثل الإجابة على الأسئلة ، وتصنيف الميم البغيض ، وتحويل النص إلى كلام ، واسترجاع الصور النصية. في العصر الحالي لوسائل التواصل الاجتماعي ، حيث أصبح التنمر عبر الإنترنت منتشرًا بشكل متزايد ، يحمل بحث كومار أهمية.
تمثل الميمات البغيضة ، التي تشمل خطاب الكراهية الذي يستهدف الأفراد على وسائل التواصل الاجتماعي ، تحديًا مقلقًا. بينما توجد تقنيات مختلفة لتصنيف مثل هذه الميمات ، ابتكر كومار نهجًا مباشرًا يجمع بشكل فعال بين ميزات الصورة والنص للتنبؤ باحتمالية الكراهية. يمكن أن يؤدي ذلك إلى تمكين منصات وسائل التواصل الاجتماعي من اتخاذ قرارات مستنيرة بشأن ما يجب نشره وما لا ينبغي نشره.
كما شارك في التطوير المشترك لمنصة Autodub الحائزة على جوائز ، وهي عبارة عن منصة لدبلجة الذكاء الاصطناعي البشرية في حلقة تهدف إلى إزالة الحواجز اللغوية في محتوى الفيديو التعليمي لتعزيز التعلم عن بُعد عبر الإنترنت في جميع أنحاء العالم. يدمج Autodub بسلاسة النسخ والترجمة والتعليق الصوتي وفصل الصوت في الخلفية لإنشاء ترجمات دقيقة وتعزيز إمكانية الوصول للجميع. نظرًا لأن العديد من مقاطع الفيديو التعليمية باللغة الإنجليزية بشكل أساسي ، فقد يؤدي ذلك إلى إنشاء عائق أمام المتحدثين غير الناطقين باللغة الإنجليزية. يقدم Autodub حلاً قابلاً للتطبيق لهذا التحدي.
“ما يثيرني حقًا بشأن مسيرتي المهنية المستقبلية هو الفرصة لإحداث تأثير ملموس. إذا تمكنت من تطوير شيء ما يعزز العمليات ، وبالتالي ، يؤثر بشكل إيجابي على عدد كبير من الأفراد ، فسيكون ذلك رائعًا حقًا. فقط عدد قليل من المجالات أو التقنيات لديها القدرة على إنشاء شيء يجذب على الفور اهتمامًا واسع النطاق ويثير المحادثات عبر مجتمعات مختلفة “.
الانضمام إلى G42 كعالم
كان أحد المتابعين المتحمسين لفريق تشيناي سوبر كينجز للكريكيت ، يتذكر ذكرياته المفضلة عن الإمارات عندما رأى فريقه ينتزع لقب الموسم في عام 2021 في دبي ، بالتزامن مع بداية رحلة سيده. إضافة إلى الإثارة ، فاز فريقه مرة أخرى قبل أيام فقط من حفل الافتتاح.
التحدي التالي الذي يواجهه هو المساعدة في تطوير نماذج لغوية كبيرة لدولة الإمارات العربية المتحدة – الدولة التي حددت الاستفادة من الذكاء الاصطناعي من أجل الخير كأولوية رئيسية.
“سألتحق بمعهد G42 للذكاء الاصطناعي (IIAI) كعالم تطبيقي ، حيث سأعمل بشكل تعاوني في فريق لتطوير نماذج لغوية كبيرة مصممة خصيصًا للتطبيقات التي تركز على دولة الإمارات العربية المتحدة.”
كومار هو أول من حصل على درجة الماجستير في عائلته. كما أنه حاصل على درجة البكالوريوس في تكنولوجيا المعلومات من جامعة آنا ، تشيناي. إنه واحد من 59 طالبًا من طلاب الرؤية الحاسوبية والتعلم الآلي ومعالجة اللغة الطبيعية الذين تخرجوا كجزء من فصل 2023.