中新社北京2月6日電 (記者 夏賓)乙巳蛇年,中國大模型密集“上新”,引發各方關注。
一邊是阿里云旗下大模型全新版本升級發布。1月29日凌晨,阿里云通義團隊發布的Qwen2.5-Max,該模型是阿里云通義團隊對MoE(混合專家模式)模型的最新探索成果,預訓練數據超過20萬億tokens。該新模型展現強勁的綜合性能,在多項公開主流模型評測基準上錄得高分。
另一邊是DeepSeek(深度求索)大模型迎來大量新平臺的接入上架。2月5日,華為表示,DeepSeek系列新模型正式上線昇騰社區。
此前,國家超算互聯網平臺也已上線DeepSeek系列模型。用戶目前也可在百度智能云、騰訊云、360數字安全等平臺上調用DeepSeek模型。
第三方大模型性能測試平臺Chatbot Arena近日公布的最新大模型盲測榜單顯示,包括DeepSeek、阿里云、智譜在內的多家中國公司旗下大模型憑借出眾的性能躋身前列,這些國產大模型在部分單項性能上也實現了對海外主流大模型的趕超。
據悉,Chatbot Arena目前已集成190多種模型,該平臺推出的測評榜單采用匿名方式將大模型兩兩組隊,交給用戶盲測,用戶根據真實對話體驗對模型能力進行投票。
上述榜單成績在中外社交媒體上引發熱議。在小紅書上,“大模型中國造”成了新詞,有網友直言:“期待國產大模型越來越好,給海內外帶來新的震撼!”
在X上,不少海外網友表示,中國新模型的迭代速度和質量令人驚艷,甚至還有人打趣地為OpenAI首席執行官奧特曼(Sam Altman)擔憂。
平安證券研究報告稱,近期,國產大模型產品密集更新和迭代升級,中國算法能力及模型效果逐漸接近和趕超國際主流產品,國產大模型應用落地步伐有望加速。
微軟首席執行官薩提亞·納德拉在今年的冬季達沃斯論壇上表示,DeepSeek的新模型令人印象深刻,尤其是在如何高效開發開源模型并進行推理計算方面,它的計算效率非常出色。“我們應當非常、非常認真地對待來自中國的這些技術進展。”
華泰證券策略研究近期發布報告則提到,中美科技股估值在過去兩年分化顯著,AI發展水平或是關鍵。DeepSeek具有低成本、高性能優勢,引發行業對資本開支、應用場景等討論,或推動投資者重新評估中國科技企業的技術潛力,進而催化中美科技股價值重估。
中信證券研究報告認為,2025年有望成為A股市場主題投資大年,主題賽道是市場普遍關注的焦點,多個因素將共同推動2025年全年A股市場的主題投資機遇,其中之一便是,在AI等新技術成熟和新商業模式清晰催化下,更多新興產業有望步入高速成長期。(完)