文心、訊飛星火之后,通義千問也公布大版本迭代 綜合性能超GPT-3.5
封面新聞記者 歐陽宏宇
繼日前文心大模型、星火認知大模型完成迭代,又一頭部通用大模型也宣告升級。
10月31日,阿里云在杭州正式發(fā)布了通義千問2.0。據(jù)介紹,通義千問2.0擁有千億級參數(shù),綜合性能超過GPT-3.5,正在加速追趕GPT-4。現(xiàn)場,阿里云CTO周靖人透露,通義千問的APP版本在各大手機應用市場正式上線,所有人都可通過APP直接體驗。
大模型是本輪AI浪潮的核心技術,基礎模型的質量很大程度決定了AI產業(yè)化的前景。周靖人介紹,過去6個月,通義千問2.0在性能上取得巨大飛躍,相比4月發(fā)布的1.0版本,新版本在復雜指令理解、文學創(chuàng)作、通用數(shù)學、知識記憶、幻覺抵御等能力上均有顯著提升。
在具體能力方面,中英文理解、數(shù)學計算、代碼推理能力是大語言模型的基本功。據(jù)了解,以英語任務為例,通義千問2.0在MMLU基準中僅次于GPT-4;在HumanEval測試中,其得分也緊跟GPT-4和GPT-3.5。
模型能力的提升,也帶來了市場需求的擴容,千行百業(yè)都想借助大模型實現(xiàn)生產和服務方式的變革。類似于文心大模型4.0推出后上線了十余款原生應用,星火大模型升級至3.0版本后,新增了虛擬人格、心理健康等功能,更多的通用大模型也在垂直場景深化布局。
據(jù)介紹,通義大模型2.0也同步訓練了包括編碼、閱讀、研投等垂類大行業(yè)模型。開發(fā)者可以通過網頁嵌入、API/SDK調用等方式,這些模型能力集成到自己的大模型應用和服務中。
“隨著大模型技術與云計算本身的融合,我們希望未來的云可以像車一樣也能夠自動駕駛,大幅提升開發(fā)者使用云的體驗。”周靖人回憶稱,他此前提到過“數(shù)據(jù)中心就是一臺計算機”的理念,今天,AI時代更加需要這樣的技術體系。“云計算就是一臺超級計算機,可高效連接異構計算資源,突破單一性能芯片瓶頸,協(xié)同完成大規(guī)模智能計算任務,攜手千行百業(yè)推動AI創(chuàng)新,共享技術紅利。”
【如果您有新聞線索,歡迎向我們報料,一經采納有費用酬謝。報料微信關注:ihxdsb,報料QQ:3386405712】
- 夏普20818L代碼F2(如何解決故障)05-05
-
美的電磁爐eb什么故障(標題:美的電磁爐EB故障解決方案:診斷與修復步驟陳述
2024-08-25
-
AERMEC空調維修服務部(如何利用AERMEC空調維修服務部解決空調問題?)
2024-08-25
-
CITEC空調廠家售后網點(如何找到CITEC空調廠家的官方售后維修服務網點?)
2024-08-25
-
有圖像無伴音故障部件(解決有圖像無伴音故障的部件問題:一步步排查與修復
2024-08-25