منذ أن أثار ChatGPT طفرة في الاستثمار في الذكاء الاصطناعي ، ظهرت النماذج المحلية واسعة النطاق مثل عيش الغراب. اعتبارًا من بداية يوليو ، كان هناك أكثر من 80 نموذجًا للذكاء الاصطناعي على نطاق واسع بمقياس متغير يزيد عن 1 مليار في الصين. في ظل هذا الاتجاه الجديد ، كيف ينبغي اختيار النماذج المحلية واسعة النطاق؟ أي نموذج كبير هو الأقوى؟
في 12 أغسطس ، أصدر مركز أبحاث تنمية المشاريع الصينية التابع لمعهد الأبحاث لوكالة أنباء شينخوا "تقرير تجربة نموذج كبير للذكاء الاصطناعي 2.0" (يشار إليه فيما يلي باسم "التقرير") ، وهو أكثر المشاريع المحلية شيوعًا مثل باسم Baidu Wenxin Yiyan و Ali Tongyi Qianwen. يتم تقييم تطبيقات النماذج الكبيرة العامة.
تم تصميم ما مجموعه 500 سؤال عشوائي لهذا التقييم ، مع المقارنة بالمستوى البشري الذين تلقوا تعليمًا عاليًا ، والتأكيد على القيمة الفعلية للصناعة والحياة ، ووفقًا لمؤشر القدرة الأساسية الأربعة ، ومؤشر الذكاء ، ومؤشر EQ ، والأداة. مؤشر الكفاءة يتم ترجيح بُعد التقييم لضمان دقة عملية التقييم بأكملها.
كانت النتيجة النهائية مفاجئة بعض الشيء. ** احتلت Xunfei Xinghuo المرتبة الأولى في هذا التقييم بمجموع نقاط 1013 ، واحتلت المرتبة الأولى في بعدي مؤشر الذكاء ومؤشر كفاءة الأداة بين أبعاد التقييم الأربعة ؛ Baidu Wenxin Yiyan احتلت المرتبة الثانية والثالثة على التوالي مع SenseTime. **
وفقًا لـ "التقرير" ، تمتلك Xunfei Xinghuo سبع قدرات أساسية ، وهي إنشاء النص ، وفهم اللغة ، وسؤال وجواب المعرفة ، والتفكير المنطقي ، والقدرة الرياضية ، والقدرة على الترميز ، والقدرة متعددة الوسائط. يمتلك المعرفة عبر المجالات والقدرة على فهم اللغة ، ويكون قادرًا على فهم وأداء المهام بناءً على الحوار الطبيعي.
** في جزء القدرة الأساسية ، الفجوة بين البشر والذكاء الاصطناعي ليست كبيرة. ** أداء Baidu Wenxin هو الأكثر لفتًا للنظر بين الطرز ؛ SenseTime و Zhipu AI hatGLM و 360 Smart Brain كان أداءها جيدًا و Xunfei Xinghuo و Ali Tongyi Qianwen و Lanzhou Technology Mchat و Kunlun Wanwei Tiangong كان أداؤها جيدًا لا يزال جيدًا.
** فيما يتعلق بتقييم معدل الذكاء ** ، ** لا يزال لدى البشر ميزة واضحة ، والنتائج هي الأعلى. ** من بين جميع الطرز التي تم تقييمها ، احتلت Xunfei Xinghuo و Zhipu A-ChatGLM المرتبة الأولى ؛ وكان أداء Baidu Wenxin Yiyan و Kunlun Wanwei Tiangong جيدًا.
** تظهر الفجوة بين الذكاء الاصطناعي والبشر بشكل أكثر وضوحًا عندما يتعلق الأمر بالذكاء العاطفي. ** ذكر "التقرير" أنه لم يتم ملاحظة أي علامات واضحة على قدرة الذكاء الاصطناعي على إدراك المشاعر. على الرغم من ذلك ، أظهرت ** SenseTime موازنة عالية ** تجاوزت نظيراتها ** ، حيث احتلت المرتبة الأولى برصيد 346 ، واحتلت Baidu Wenxin Yiyan و Lanzhou Technology · Mchat المرتبة الثانية والثالثة على التوالي.
** أخيرًا ، فيما يتعلق بتحسين كفاءة العمل ** ، يعتقد "التقرير" أن الذكاء الاصطناعي يوفر دعمًا قويًا للبشر ، وأن سرعة معالجة الذكاء الاصطناعي تتجاوز بكثير سرعة البشر. ومع ذلك ، على الرغم من مزايا السرعة العالية والكفاءة العالية للذكاء الاصطناعي ، لا يزال الذكاء والخيال البشري يلعبان دورًا لا غنى عنه في بعض المهام المعقدة والمبتكرة. تظهر نتائج التقييم أن Xunfei Xinghuo احتلت المرتبة الأولى برصيد 350 درجة وتتقدم بفارق كبير ، في حين احتلت Baidu Wenxin Yiyan و Shangtang Shangdi المرتبة الثانية والثالثة على التوالي.
يعتقد "التقرير" أنه بالمقارنة مع يونيو 2023 ، حققت المنتجات النموذجية واسعة النطاق الحالية في الصين تقدمًا كبيرًا. ومع ذلك ، بالمقارنة مع البشر المتعلمين تعليماً عالياً ، لا تزال هناك درجة معينة من الفجوة بين النماذج الكبيرة من حيث معدل الذكاء و EQ. على الرغم من أن الذكاء الاصطناعي والبشر يظهرون في مجالات مختلفة مزايا وعيوب مختلفة ، إلا أن تطوير نماذج واسعة النطاق للذكاء الاصطناعي قد أحدث تأثيرات إيجابية مهمة على جودة وكفاءة العمل البشري والحياة ، والنماذج واسعة النطاق تتسارع. في Live ودخول الصناعة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
أصدر معهد أبحاث وكالة أنباء شينخوا تقريرًا عن النماذج المحلية واسعة النطاق: Xunfei Xinghuo No. 1، Baidu Wenxin No. 2
المؤلف: بو Shuqing
منذ أن أثار ChatGPT طفرة في الاستثمار في الذكاء الاصطناعي ، ظهرت النماذج المحلية واسعة النطاق مثل عيش الغراب. اعتبارًا من بداية يوليو ، كان هناك أكثر من 80 نموذجًا للذكاء الاصطناعي على نطاق واسع بمقياس متغير يزيد عن 1 مليار في الصين. في ظل هذا الاتجاه الجديد ، كيف ينبغي اختيار النماذج المحلية واسعة النطاق؟ أي نموذج كبير هو الأقوى؟
في 12 أغسطس ، أصدر مركز أبحاث تنمية المشاريع الصينية التابع لمعهد الأبحاث لوكالة أنباء شينخوا "تقرير تجربة نموذج كبير للذكاء الاصطناعي 2.0" (يشار إليه فيما يلي باسم "التقرير") ، وهو أكثر المشاريع المحلية شيوعًا مثل باسم Baidu Wenxin Yiyan و Ali Tongyi Qianwen. يتم تقييم تطبيقات النماذج الكبيرة العامة.
تم تصميم ما مجموعه 500 سؤال عشوائي لهذا التقييم ، مع المقارنة بالمستوى البشري الذين تلقوا تعليمًا عاليًا ، والتأكيد على القيمة الفعلية للصناعة والحياة ، ووفقًا لمؤشر القدرة الأساسية الأربعة ، ومؤشر الذكاء ، ومؤشر EQ ، والأداة. مؤشر الكفاءة يتم ترجيح بُعد التقييم لضمان دقة عملية التقييم بأكملها.
كانت النتيجة النهائية مفاجئة بعض الشيء. ** احتلت Xunfei Xinghuo المرتبة الأولى في هذا التقييم بمجموع نقاط 1013 ، واحتلت المرتبة الأولى في بعدي مؤشر الذكاء ومؤشر كفاءة الأداة بين أبعاد التقييم الأربعة ؛ Baidu Wenxin Yiyan احتلت المرتبة الثانية والثالثة على التوالي مع SenseTime. **