GPT-5: هل خيبت آمال الذكاء الخارق؟

استقبال فاتر لـ GPT-5: هل انتهى عصر المبالغة في الذكاء الخارق؟

ردود فعل فاترة وتقدم تدريجي

شهد طرح نموذج GPT-5 من OpenAI ردود فعل فاترة، مما يثير تساؤلات جدية حول مدى المبالغة في الحديث عن "الذكاء الخارق". فبعد عام تقريبًا من تصريح سام التمان، الرئيس التنفيذي للشركة، بأن الذكاء الاصطناعي الخارق أصبح "قاب قوسين أو أدنى"، يبدو أن GPT-5 لا يمثل سوى تقدم تقني تدريجي وليس القفزة الثورية المنتظرة. وقد أثار هذا الإطلاق قدرًا كبيرًا من ردود الفعل السلبية والانتقادات الإعلامية، وهو أمر مفاجئ بالنظر إلى الاستقبال الإيجابي الذي حظيت به النماذج مفتوحة المصدر التي سبقت هذا الإصدار.

الأداء في الاختبارات وتحديات البرمجة


لقطة مقربة لشاشة تعرض أسطرًا من التعليمات البرمجية

يشير النقاد إلى أن GPT-5 يعاني من مشاكل فنية أولية، مثل آلية تبديل غير مستقرة بينه وبين GPT-4o، بالإضافة إلى شكاوى المستخدمين من "الاستجابات البطيئة، والهلوسة، والأخطاء المفاجئة". وعلى الرغم من أن GPT-5 أظهر تحسنًا في بعض الاختبارات المعيارية، إلا أنه لم يحقق القفزة النوعية المأمولة. فعلى سبيل المثال، سجل GPT-5 أداءً أفضل من بعض النماذج السابقة في اختبار "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI-2)، وهو مقياس مصمم لتقييم قدرة الذكاء الاصطناعي على حل المشكلات المجردة التي لم يواجهها من قبل، ما يُعتبر مؤشراً هاماً على الذكاء العام. لكنه جاء أقل من Grok-4 الذي طورته شركة xAI التابعة لإيلون ماسك. وفي النموذج الأقدم من اختبار AGI، المعروف بـ ARC-AGI-1، سجل GPT-5 نسبة 67.5% صحيحة، وهي أقل من نسبة 76% التي حققها نموذج OpenAI الأقدم، o3.

وفي مجال البرمجة، يرى البعض أن GPT-5 يمثل تراجعًا، فعلى الرغم من أنه قدم "قفزة" في تحليل مستودعات التعليمات البرمجية، إلا أنها لم تكن "مُغيرة للعبة" كما كان متوقعًا. وقد أدت هذه النتائج إلى تعزيز وجهة نظر النقاد بأن الحديث المستمر عن الذكاء الخارق مبالغ فيه، وأن ما تم تحقيقه حتى الآن هو مجرد تقدم طبيعي ومتوقع في مسار تطوير نماذج اللغة الكبيرة.

حقيقة "الاستدلال" وتفنيد المزاعم

على الرغم من الدعاية السلبية، من غير المرجح أن يتخلى التمان وغيره من رواد الصناعة عن خطاب الذكاء الخارق. ومع ذلك، فإن غياب أي اختراق "معرفي" حقيقي في GPT-5، بعد كل هذه التوقعات، قد يؤدي إلى تدقيق أعمق للمصطلحات التي يتم تداولها بشكل متكرر، مثل "التفكير" و"الاستدلال". وتركز البيانات الصحفية لـ GPT-5 على تميز النموذج في ما يسمى بالاستدلال، حيث تولد نماذج الذكاء الاصطناعي مخرجات مطولة حول عملية الوصول إلى إجابة للمطالب، وهي تقنية تُعرف بـ "سلسلة الأفكار" (Chain-of-Thought). وتزعم الشركة أنه "عند استخدام الاستدلال، يكون GPT-5 قابلاً للمقارنة أو أفضل من الخبراء في حوالي نصف الحالات".

ومع ذلك، فقد تصدت فرق بحثية في الصناعة لهذه المزاعم مؤخرًا. ففي ورقة بحثية واسعة الانتشار لباحثين من شركة أبل، خلص الباحثون إلى أن ما يسمى بنماذج الاستدلال الكبيرة (LRMs) لا "تستدل" باستمرار بأي معنى يتوقعه المصطلح العامي. وبدلاً من ذلك، تميل هذه البرامج إلى أن تصبح غير منتظمة في طريقة تعاملها مع المشاكل التي تزداد تعقيدًا. كما أشار باحثون آخرون إلى أن "سلسلة الأفكار"، وهي المخرجات المطولة التي تنتجها هذه النماذج، "غالبًا ما تؤدي إلى تصور بأنها تشارك في عمليات استدلال متعمدة". لكنهم استنتجوا أن الواقع هو في الواقع "أكثر سطحية مما يبدو".

الخلاصة: نحو توقعات أكثر واقعية

تتحدى هذه التقييمات التقنية المبالغات في خطاب التمان وغيره، والتي تستغل مفاهيم الذكاء بتأكيدات عارضة وغير مدعومة بأدلة قاطعة. ومن المفيد للمستخدم العادي أيضًا أن يفند هذه المبالغة، وأن ينتبه جيدًا للطريقة المتهورة التي يتم بها استخدام مصطلحات مثل "الذكاء الخارق". فقد يؤدي ذلك إلى تكوين توقعات أكثر واقعية عند وصول GPT-6 في المستقبل.

Next Post Previous Post
No Comment
Add Comment
comment url