體驗感受哪家強？《人工智能大模型體驗報告2.0》發布

2023-08-12 18:04:03 經濟參考網

近來，人工智能大模型風云起涌，不少科技企業加快拓寬應用生態。主流大模型的實際使用感受如何？各大科技企業有何優劣勢？8月12日，新華社研究院中國企業發展研究中心發布的《人工智能大模型體驗報告》（以下簡稱報告）顯示，訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現搶眼，AI大模型的發展為人類工作和生活的提質增效均帶來了正向積極的影響。

(相關資料圖)

今年以來，國內科技企業紛紛布局人工智能大模型。據不完全統計，在新一輪生成式AI熱潮中，國內已經出現了上百個大模型。天眼查數據顯示，截至2023年上半年，與“大模型”直接相關的融資事件超20起。

為進一步直觀感受我國當前主流科技企業所推出的大模型產品的現狀、優勢和特點，新華社研究院中國企業發展研究中心于今年7月啟動了本次報告研究。與2023年6月首次發布的《人工智能大模型體驗報告》相比，本次測評在題目設計、對標Benchmark（人類）、打分權重、專家測評團隊四大維度進行了全面升級。

其中，在題目設計方面，測評題目由300道擴展至500道，并進一步完善了題目分類；在對標Benchmark方面，本次測評將接受過高等教育的人類作為對照，來考評大模型真實能力；在打分標準上，本次測評根據對產業、生活的實際價值，對基礎能力、智商能力、情商能力和工具提效四大測評維度進行了權重設計；在測評團隊方面，本次測評特邀北京大學文化與傳播研究所及其他產界、學界專家全程參與。

本次研究設置了用戶體驗項目，抓取了7月31日—8月4日數據，通過人機互動提問等形式，對國內主流大模型進行使用體驗評測，旨在為科技企業調整努力方向提供參考。

報告顯示，與2023年6月相比，當前中國大模型產品進步顯著。但與接受過高等教育的人類相比，大模型在智商、情商等方面還存在一定程度差距。具體來看，訊飛星火在工作提效方面優勢明顯，百度文心一言基礎能力仍處領軍水準，商湯商量則在情商方面表現優秀，智譜AI-ChatGLM整體表現優秀。

針對各維度能力測評，該報告還給出了相應的案例展示和分析。

在基礎能力方面，人類與AI之間的差距并不顯著。課題組分別從語言能力（35%）、AI向善（10%）、跨模態（20%）和多輪對話（35%）四大指標進行測評。測評顯示，科技企業大模型中，百度文心一言表現最為搶眼，商湯商量、智譜AI-ChatGLM、360智腦表現優良。

在智商評估方面，人類在智商方面仍然具有明顯優勢。課題組分別從常識知識（20%）、邏輯能力（50%）和專業知識（30%）方面對科技企業大模型進行考量。結果顯示，訊飛星火、智譜AI-ChatGLM表現突出，百度文心一言、昆侖萬維天工表現優良。

在情商方面，AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強的優勢，和更靈活的處理能力。通過對處理日常事項（35%）、一語雙關（30%）、人際關系（35%）問題進行分析發現，科技企業大模型中，商湯商量表現亮眼，百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現優良。

在工作效率提升方面，課題組重點在工具提效（50%）和生成創新（50%）方面進行考量。結果顯示，訊飛星火表現最為搶眼，百度文心一言、商湯商量、智譜AI-ChatGLM表現優良。不過，盡管AI具有高速度和高效率的優勢，但在某些復雜和具有創新性的任務中，人類的智慧和想象力仍然具有無法替代的作用。

報告認為，雖然在不同領域中，AI和人類表現出不同的優劣勢，但在整體上，AI大模型的發展為人類工作和生活的提質增效帶來了重要的積極影響，大模型正在加速走進生活、走進產業。在本次體驗測評基礎上，研究團隊將繼續深耕，加強在大模型安全可解釋性、工作提效能力、實際落地情況、產業優秀案例等維度上的探索與研究。

（文章來源：經濟參考網）

標簽：

精彩推薦

應急管理部派工作組赴西安指導山洪泥石流救援處置 2023-08-12 17:42:58
西安高新區魚化寨街道舉辦廣場舞大賽 2023-08-12 16:31:41
《孤注一擲》挺有意思的一部反詐反賭宣傳片 2023-08-12 15:17:18
妻子實名舉報醫生老公每年回扣十幾萬，且婚內... 2023-08-12 14:15:02
體驗感受哪家強？《人工智能大模型體驗報告2.0... 2023-08-12 18:04:03
不再是媒體排名！12萬球迷票選現役第一人，詹... 2023-08-12 17:36:14
“5+2座科技旗艦SUV”瑞虎8 PRO冠軍版正式全... 2023-08-12 17:36:39
應急管理部派工作組赴西安指導山洪泥石流救援處置 2023-08-12 17:42:58
如何“移動化生存”？ 2023-08-12 17:14:11
阜康市公安局食藥環大隊聯合農業農村局對屠宰... 2023-08-12 16:59:24
突發公共事件是指（關于突發公共事件是指的基... 2023-08-12 16:53:55
都罵特斯拉，都想成為特斯拉 2023-08-12 16:43:02
西安高新區魚化寨街道舉辦廣場舞大賽 2023-08-12 16:31:41
鄭州富士康技術員招聘 2023-08-12 16:24:41
2023廣東省伊斯蘭教協會招聘高校畢業生名單公示 2023-08-12 15:22:32
廣東省文化和旅游廳幼兒園招聘高校畢業生擬聘... 2023-08-12 15:31:50
“那么多出版社、學校支持，我們肯定要干下去！” 2023-08-12 15:22:51
weight是什么意思翻譯成中文 weight是什么意思 2023-08-12 15:29:02
驚喜！杜鋒帶隊出戰村BA，球員達5人，徐杰領銜... 2023-08-12 15:17:59
“青”心有約文明實踐活動進村居，中醫康養首... 2023-08-12 15:23:52
一類卡一天可以取多少現金一類卡和二類卡的區別 2023-08-12 15:15:28
《孤注一擲》挺有意思的一部反詐反賭宣傳片 2023-08-12 15:17:18
鄭州市農購網網上購物節活動2023年 2023-08-12 14:24:47
鄭州市唯品會平臺網上購物節活動2023年 2023-08-12 14:32:23
鄭州市網上購物節活動2023年 2023-08-12 14:33:50
鄭州市抖音平臺網上購物節活動2023年 2023-08-12 14:22:39
奧比島怎么玩詳細步驟 7k7k奧比島快速進入 2023-08-12 14:29:58
2023年上半年貴州各市GDP排行榜遵義增速最快... 2023-08-12 14:21:56
為工作社交“做減法”年輕人開始在閑魚上代找... 2023-08-12 14:18:39
第19屆亞運會電子競技項目國家集訓隊動員大會... 2023-08-12 14:17:51
夫妻離婚糾紛孩子如何辦 2023-08-12 14:12:16
妻子實名舉報醫生老公每年回扣十幾萬，且婚內... 2023-08-12 14:15:02
綠色低碳看煙臺|一頭牛“耕出”種養循環產業鏈 2023-08-12 13:10:00
茅盾文學獎·連線｜喬葉：女性照耀的絕不僅僅... 2023-08-12 13:01:58

新聞頻道更多

社會頻道更多

財經頻道更多

五月天六月婷婷开心激情,天使的性电影,三级韩国一区久久二区综合,五月婷婷久,九九精品在线视频,66精品综合久久久久久久

體驗感受哪家強？《人工智能大模型體驗報告2.0》發布