اقتصاد

خبراء الذكاء الاصطناعي يستعدون لـ”الامتحان الأخير للبشرية” لإحباط التكنولوجيا القوية – أخبار

كتب

الثلاثاء 17 سبتمبر 7:20 ص

أصدر فريق من خبراء التكنولوجيا نداءً عالميًا يوم الاثنين بحثًا عن أصعب الأسئلة التي يمكن طرحها على أنظمة الذكاء الاصطناعي، والتي تتعامل بشكل متزايد مع اختبارات معيارية شائعة مثل لعب الأطفال.

ويهدف المشروع، الذي أطلق عليه اسم “آخر اختبار للبشرية”، إلى تحديد موعد وصول الذكاء الاصطناعي على مستوى الخبراء. ويهدف المشروع إلى البقاء ذا صلة حتى مع تقدم القدرات في السنوات القادمة، وفقًا للمنظمين، وهي مؤسسة غير ربحية تسمى مركز سلامة الذكاء الاصطناعي (CAIS) وشركة Scale AI الناشئة.

وتأتي هذه الدعوة بعد أيام من عرض صانع ChatGPT لنموذج جديد، يُعرف باسم OpenAI o1، والذي “دمر معايير التفكير الأكثر شعبية”، وفقًا لما قاله دان هندريكس، المدير التنفيذي لـ CAIS ومستشار شركة xAI الناشئة التابعة لإيلون ماسك.

شارك هندريكس في تأليف ورقتين بحثيتين في عام 2021 اقترحتا اختبارات لأنظمة الذكاء الاصطناعي التي تُستخدم الآن على نطاق واسع، حيث اختبرها أحدهما على مستوى المعرفة الجامعية بموضوعات مثل تاريخ الولايات المتحدة، بينما اختبر الآخر قدرة النماذج على التفكير من خلال الرياضيات على مستوى المنافسة. يحتوي الاختبار الجامعي على عدد أكبر من التنزيلات من مركز الذكاء الاصطناعي عبر الإنترنت Hugging Face مقارنة بأي مجموعة بيانات من هذا القبيل.

في وقت نشر هذه الأوراق البحثية، كانت الذكاء الاصطناعي تقدم إجابات عشوائية تقريبًا على أسئلة الامتحانات. وقال هندريكس لرويترز: “لقد سحقوا الآن”.

على سبيل المثال، انتقلت نماذج كلود من مختبر الذكاء الاصطناعي أنثروبيك من تسجيل حوالي 77% في اختبار المستوى الجامعي في عام 2023، إلى ما يقرب من 89% بعد عام، وفقًا لجدول المتصدرين البارزين للقدرات.

ونتيجة لهذا فإن هذه المعايير المشتركة أصبحت أقل أهمية.

وبحسب تقرير مؤشر الذكاء الاصطناعي لجامعة ستانفورد الصادر في أبريل/نيسان، يبدو أن الذكاء الاصطناعي يسجل نتائج ضعيفة في الاختبارات الأقل استخدامًا والتي تتضمن صياغة الخطط وألغاز التعرف على الأنماط البصرية. على سبيل المثال، قال منظمو اختبار ARC-AGI يوم الجمعة إن OpenAI o1 سجل حوالي 21 في المائة في نسخة واحدة من اختبار التعرف على الأنماط ARC-AGI.

يزعم بعض الباحثين في مجال الذكاء الاصطناعي أن نتائج مثل هذه تظهر أن التخطيط والتفكير المجرد هما مقياسان أفضل للذكاء، على الرغم من أن هندريكس قال إن الجانب البصري لـ ARC يجعله أقل ملاءمة لتقييم نماذج اللغة. وقال إن “الامتحان الأخير للبشرية” سيتطلب التفكير المجرد.

وقال مراقبو الصناعة إن الإجابات من معايير مشتركة ربما انتهت أيضًا إلى بيانات تستخدم لتدريب أنظمة الذكاء الاصطناعي. وقال هندريكس إن بعض الأسئلة في “الامتحان الأخير للبشرية” ستظل خاصة للتأكد من أن إجابات أنظمة الذكاء الاصطناعي ليست من الحفظ.

سيتضمن الاختبار ما لا يقل عن 1000 سؤال تم جمعها من الجمهور، ومن المقرر أن يتم تسليمها في الأول من نوفمبر/تشرين الثاني، والتي يصعب على غير الخبراء الإجابة عليها. وستخضع هذه الأسئلة لمراجعة الأقران، مع تقديم المشاركات الفائزة بالمشاركة في التأليف وجوائز تصل إلى 5000 دولار برعاية Scale AI.

قال ألكسندر وانج، الرئيس التنفيذي لشركة سكيل: “نحن بحاجة ماسة إلى اختبارات أكثر صرامة للنماذج على مستوى الخبراء لقياس التقدم السريع للذكاء الاصطناعي”.

هناك قيد واحد: لا يريد المنظمون طرح أي أسئلة حول الأسلحة، والتي يقول البعض إنها ستكون خطيرة للغاية بحيث لا يمكن للذكاء الاصطناعي دراستها.

في هذا المقال:رائج الآن

اضف تعليقك

اترك تعليقك
إلغاء الرد

الخليج

ذكاء اصطناعي أم حقيقة؟.. إماراتي يكشف أسرار المحتوى المزيف في زمن الأزمات

مع تزايد التحديات التي تواجه البلاد، يبرز دور متخصصي الذكاء الاصطناعي في مكافحة انتشار المعلومات المضللة والمحتوى المزيف. في ظل الأزمات، يصبح التحقق من...

فريق التحريرمنذ 11 ساعة

تكنولوجيا

تفاصيل اختراق مدير FBI المزعوم من قبل مجموعة إيرانية

في تطور مثير للقلق، كشف عن انتشار واسع النطاق لظاهرة التضليل الإعلامي باستخدام الذكاء الاصطناعي. فقد انخدع آلاف المستخدمين على وسائل التواصل الاجتماعي بشخصية...

فريق التحريرمنذ 11 ساعة

رياضة

أزمة المنتخب وفشل الاتحاد السعودي لكرة القدم في الإدارة

في عالم كرة القدم، الهزيمة واردة، ولكن فقدان الروح القتالية أمر غير مقبول. الهزيمة الأخيرة للمنتخب السعودي أمام نظيره المصري لم تكن مجرد نتيجة...

فريق التحريرمنذ 15 ساعة

فنون وثقافة

تطورات قضية حسابات شيرين عبدالوهاب وانتصارها قانونياً

شهدت الساحة الفنية المصرية تطورات هامة في قضية حسابات الفنانة شيرين عبدالوهاب على وسائل التواصل الاجتماعي، حيث أصدرت المحكمة الاقتصادية حكمًا بتغريم المتهم وتعويض...

فريق التحريرمنذ يومين

فنون وثقافة

عبدالله حمير: مهرجان الفنون التقليدية يدعم الشعر والمواهب

أكد عبدالله حمير القحطاني، أن مهرجان الفنون التقليدية، الذي تقام فعالياته حاليًا، يمثل دعمًا كبيرًا للشعر النبطي والمحاورة، بالإضافة إلى اكتشاف ورعاية المواهب الشابة...

فريق التحريرمنذ يومين

الخليج

محمد بن راشد يصدر قانون أكاديمية شرطة دبي

error code: 524

فريق التحريرمنذ يومين

اقتصاد

ضمن خطة الـ 100 بئر.. حفر بئرين جديدتين للغاز في البحر المتوسط بمصر

أعلنت شركة أركيوس إنرجي (Arkus Energy) عن استعدادها لبدء عمليات حفر بئرين جديدين للغاز والبترول في مصر، وهما “أتول غرب” و”نوفريت”. تأتي هذه الخطوة...

فريق التحريرمنذ 3 أيام

صحة

تكلفته أقل ونتائجه واعدة.. علاج غير جراحي لتساقط الشعر يلقى رواجا متزايدا

مع تزايد القلق بشأن تساقط الشعر، يكتسب علاج غير جراحي شعبية متزايدة. يتمثل هذا العلاج في حقن البلازما الغنية بالصفائح الدموية (PRP)، والذي أصبح...

فريق التحريرمنذ 3 أيام

اخبار الرياض

اقتصاد

خبراء الذكاء الاصطناعي يستعدون لـ”الامتحان الأخير للبشرية” لإحباط التكنولوجيا القوية – أخبار

اترك تعليقك
إلغاء الرد

اترك تعليقك

رائج الآن

منوعات

موقع خصم باكواد محدثة لجميع المتاجر: دليلك الشامل للتسوّق الذكي في الخليج

اخر الاخبار

احتفالات عيد الفطر في هجرة السرو: 25 عاماً من التراث

صحة

متى يصبح سيلان اللعاب أثناء النوم علامة على مرض خطير؟

منوعات

أناقة المرأة العصرية: اكتشفي تنسيقات ناين ويست المثالية لإطلالة متجددة كل يوم

الخليج

حكايات المبدعين تحت سماء الإمارات

مقالات ذات صلة

الخليج

ذكاء اصطناعي أم حقيقة؟.. إماراتي يكشف أسرار المحتوى المزيف في زمن الأزمات

تكنولوجيا

تفاصيل اختراق مدير FBI المزعوم من قبل مجموعة إيرانية

رياضة

أزمة المنتخب وفشل الاتحاد السعودي لكرة القدم في الإدارة

فنون وثقافة

تطورات قضية حسابات شيرين عبدالوهاب وانتصارها قانونياً

فنون وثقافة

عبدالله حمير: مهرجان الفنون التقليدية يدعم الشعر والمواهب

الخليج

محمد بن راشد يصدر قانون أكاديمية شرطة دبي

اقتصاد

ضمن خطة الـ 100 بئر.. حفر بئرين جديدتين للغاز في البحر المتوسط بمصر

صحة

تكلفته أقل ونتائجه واعدة.. علاج غير جراحي لتساقط الشعر يلقى رواجا متزايدا

اترك تعليقك إلغاء الرد

اترك تعليقك

رائج الآن

منوعات

موقع خصم باكواد محدثة لجميع المتاجر: دليلك الشامل للتسوّق الذكي في الخليج

اخر الاخبار

احتفالات عيد الفطر في هجرة السرو: 25 عاماً من التراث

صحة

متى يصبح سيلان اللعاب أثناء النوم علامة على مرض خطير؟

منوعات

أناقة المرأة العصرية: اكتشفي تنسيقات ناين ويست المثالية لإطلالة متجددة كل يوم

الخليج

حكايات المبدعين تحت سماء الإمارات

مقالات ذات صلة

الخليج

ذكاء اصطناعي أم حقيقة؟.. إماراتي يكشف أسرار المحتوى المزيف في زمن الأزمات

تكنولوجيا

تفاصيل اختراق مدير FBI المزعوم من قبل مجموعة إيرانية

رياضة

أزمة المنتخب وفشل الاتحاد السعودي لكرة القدم في الإدارة

فنون وثقافة

تطورات قضية حسابات شيرين عبدالوهاب وانتصارها قانونياً

فنون وثقافة

عبدالله حمير: مهرجان الفنون التقليدية يدعم الشعر والمواهب

الخليج

محمد بن راشد يصدر قانون أكاديمية شرطة دبي

اقتصاد

ضمن خطة الـ 100 بئر.. حفر بئرين جديدتين للغاز في البحر المتوسط بمصر

صحة

تكلفته أقل ونتائجه واعدة.. علاج غير جراحي لتساقط الشعر يلقى رواجا متزايدا

اترك تعليقك
إلغاء الرد