أصدر معهد أبحاث وكالة أنباء شينخوا تقريرًا عن النماذج المحلية واسعة النطاق: Xunfei Xinghuo No. 1، Baidu Wenxin No. 2

المؤلف: بو Shuqing

منذ أن أثار ChatGPT طفرة في الاستثمار في الذكاء الاصطناعي ، ظهرت النماذج المحلية واسعة النطاق مثل عيش الغراب. اعتبارًا من بداية يوليو ، كان هناك أكثر من 80 نموذجًا للذكاء الاصطناعي على نطاق واسع بمقياس متغير يزيد عن 1 مليار في الصين. في ظل هذا الاتجاه الجديد ، كيف ينبغي اختيار النماذج المحلية واسعة النطاق؟ أي نموذج كبير هو الأقوى؟

في 12 أغسطس ، أصدر مركز أبحاث تنمية المشاريع الصينية التابع لمعهد الأبحاث لوكالة أنباء شينخوا "تقرير تجربة نموذج كبير للذكاء الاصطناعي 2.0" (يشار إليه فيما يلي باسم "التقرير") ، وهو أكثر المشاريع المحلية شيوعًا مثل باسم Baidu Wenxin Yiyan و Ali Tongyi Qianwen. يتم تقييم تطبيقات النماذج الكبيرة العامة.

تم تصميم ما مجموعه 500 سؤال عشوائي لهذا التقييم ، مع المقارنة بالمستوى البشري الذين تلقوا تعليمًا عاليًا ، والتأكيد على القيمة الفعلية للصناعة والحياة ، ووفقًا لمؤشر القدرة الأساسية الأربعة ، ومؤشر الذكاء ، ومؤشر EQ ، والأداة. مؤشر الكفاءة يتم ترجيح بُعد التقييم لضمان دقة عملية التقييم بأكملها.

كانت النتيجة النهائية مفاجئة بعض الشيء. ** احتلت Xunfei Xinghuo المرتبة الأولى في هذا التقييم بمجموع نقاط 1013 ، واحتلت المرتبة الأولى في بعدي مؤشر الذكاء ومؤشر كفاءة الأداة بين أبعاد التقييم الأربعة ؛ Baidu Wenxin Yiyan احتلت المرتبة الثانية والثالثة على التوالي مع SenseTime. **

وفقًا لـ "التقرير" ، تمتلك Xunfei Xinghuo سبع قدرات أساسية ، وهي إنشاء النص ، وفهم اللغة ، وسؤال وجواب المعرفة ، والتفكير المنطقي ، والقدرة الرياضية ، والقدرة على الترميز ، والقدرة متعددة الوسائط. يمتلك المعرفة عبر المجالات والقدرة على فهم اللغة ، ويكون قادرًا على فهم وأداء المهام بناءً على الحوار الطبيعي.

** في جزء القدرة الأساسية ، الفجوة بين البشر والذكاء الاصطناعي ليست كبيرة. ** أداء Baidu Wenxin هو الأكثر لفتًا للنظر بين الطرز ؛ SenseTime و Zhipu AI hatGLM و 360 Smart Brain كان أداءها جيدًا و Xunfei Xinghuo و Ali Tongyi Qianwen و Lanzhou Technology Mchat و Kunlun Wanwei Tiangong كان أداؤها جيدًا لا يزال جيدًا.

** فيما يتعلق بتقييم معدل الذكاء ** ، ** لا يزال لدى البشر ميزة واضحة ، والنتائج هي الأعلى. ** من بين جميع الطرز التي تم تقييمها ، احتلت Xunfei Xinghuo و Zhipu A-ChatGLM المرتبة الأولى ؛ وكان أداء Baidu Wenxin Yiyan و Kunlun Wanwei Tiangong جيدًا.

** تظهر الفجوة بين الذكاء الاصطناعي والبشر بشكل أكثر وضوحًا عندما يتعلق الأمر بالذكاء العاطفي. ** ذكر "التقرير" أنه لم يتم ملاحظة أي علامات واضحة على قدرة الذكاء الاصطناعي على إدراك المشاعر. على الرغم من ذلك ، أظهرت ** SenseTime موازنة عالية ** تجاوزت نظيراتها ** ، حيث احتلت المرتبة الأولى برصيد 346 ، واحتلت Baidu Wenxin Yiyan و Lanzhou Technology · Mchat المرتبة الثانية والثالثة على التوالي.

** أخيرًا ، فيما يتعلق بتحسين كفاءة العمل ** ، يعتقد "التقرير" أن الذكاء الاصطناعي يوفر دعمًا قويًا للبشر ، وأن سرعة معالجة الذكاء الاصطناعي تتجاوز بكثير سرعة البشر. ومع ذلك ، على الرغم من مزايا السرعة العالية والكفاءة العالية للذكاء الاصطناعي ، لا يزال الذكاء والخيال البشري يلعبان دورًا لا غنى عنه في بعض المهام المعقدة والمبتكرة. تظهر نتائج التقييم أن Xunfei Xinghuo احتلت المرتبة الأولى برصيد 350 درجة وتتقدم بفارق كبير ، في حين احتلت Baidu Wenxin Yiyan و Shangtang Shangdi المرتبة الثانية والثالثة على التوالي.

يعتقد "التقرير" أنه بالمقارنة مع يونيو 2023 ، حققت المنتجات النموذجية واسعة النطاق الحالية في الصين تقدمًا كبيرًا. ومع ذلك ، بالمقارنة مع البشر المتعلمين تعليماً عالياً ، لا تزال هناك درجة معينة من الفجوة بين النماذج الكبيرة من حيث معدل الذكاء و EQ. على الرغم من أن الذكاء الاصطناعي والبشر يظهرون في مجالات مختلفة مزايا وعيوب مختلفة ، إلا أن تطوير نماذج واسعة النطاق للذكاء الاصطناعي قد أحدث تأثيرات إيجابية مهمة على جودة وكفاءة العمل البشري والحياة ، والنماذج واسعة النطاق تتسارع. في Live ودخول الصناعة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت