2023年國內(nèi)大模型發(fā)展盤點(一)——大模型發(fā)展趨勢
(本文作者王鵬為北京市社會科學(xué)院研究員,數(shù)據(jù)資產(chǎn)化研究院執(zhí)行院長)
“十四五”期間,國家出臺了針對人工智能的未來發(fā)展相關(guān)指導(dǎo)方案和激勵政策,涵蓋“新型基礎(chǔ)設(shè)施”建設(shè)、人工智能標準化與法規(guī)以及AI安全體系建設(shè)等。過去的2023年作為承上啟下之年,如何總結(jié)評估前期成果并調(diào)整優(yōu)化策略將成為規(guī)劃實施的重要一環(huán)。而大語言模型作為人工智能領(lǐng)域最引人注目的成果之一,近年來已經(jīng)經(jīng)歷了迅速崛起的歷程,2020年Open AI GPT-3模型的發(fā)布更是極大推動了公眾對于大語言模型的關(guān)注度。本系列文章將分別回顧2023年國內(nèi)大模型發(fā)展重要趨勢,比對中美大模型發(fā)展水平明確自身缺陷及劣勢,并針對未來國內(nèi)大模型發(fā)展給出針對性建議。本文將概括2023年國內(nèi)大模型發(fā)展重點趨勢,分別從模型規(guī)模、應(yīng)用場景、技術(shù)創(chuàng)新、跨模態(tài)大模型以及產(chǎn)業(yè)化角度介紹年度發(fā)展。
一、模型規(guī)??焖僭鲩L
2023年國內(nèi)大模型規(guī)模呈現(xiàn)快速增長趨勢。從模型數(shù)量上看,據(jù)中新網(wǎng)報道,2023年1至5月間,國內(nèi)共推出了19個10億級參數(shù)規(guī)模的大語言模型,2020至2022全年推出的相同參數(shù)規(guī)模大模型分別為2個、30個與28個;從模型參數(shù)數(shù)量上來說,根據(jù)Info Q發(fā)布的《大語言模型綜合能力測評報告2023》,發(fā)布大于百億級別參數(shù)規(guī)模的模型的國內(nèi)企業(yè)已達到15家,其中包括百度ERNiE 3.0模型、華為盤古模型,以及阿里遵義模型等。該參數(shù)規(guī)模級別模型在多個自然語言處理任務(wù)上取得了顯著的性能提升。
二、應(yīng)用場景多元化
國內(nèi)大模型應(yīng)用場景不斷擴展并趨向多樣化。大模型產(chǎn)品百花齊放的當(dāng)下,模型實現(xiàn)了計算機能力從“搜索”到“認知與學(xué)習(xí)”,再以進一步發(fā)展為“行動與解決方案”層面。除常見的智能客服、智能推薦、情感分析等應(yīng)用領(lǐng)域以外,大模型逐步于教育、醫(yī)療、金融等垂直領(lǐng)域得到了廣泛應(yīng)用,為各行各業(yè)提供了智能化的解決方案。例如學(xué)而思旗下的MathGPT模型旨在解決大型語言模型在解決數(shù)學(xué)問題時的準確性、穩(wěn)定性和清晰度方面的問題,并可以提供穩(wěn)定且清晰的解題步驟,提供個性化的解釋;百川智能以平均28天的速度不斷優(yōu)化模型,專注于探索人工智能在醫(yī)療問診領(lǐng)域的應(yīng)用,并計劃于明年推出首款應(yīng)用產(chǎn)品。
三、技術(shù)創(chuàng)新不斷涌現(xiàn)
由于大模型依附于云計算實現(xiàn)模型迭代升級,而大模型算力的提升方式包含直接囤積GPU以及打造場景專屬DSA(Domain Specific Architecture)架構(gòu)芯片。國內(nèi)大模型開發(fā)過程中技術(shù)創(chuàng)新不斷涌現(xiàn)以實現(xiàn)模型規(guī)模縮小、模型性能提升。針對大模型訓(xùn)練過程中的效率問題,研究人員提出了多種優(yōu)化算法和并行計算技術(shù),顯著提高了訓(xùn)練速度和效率。年末百度發(fā)布的分別基于自研昆侖芯以及華為昇騰打造的兩款A(yù)I實例,升級AI異構(gòu)計算平臺百舸3.0,適配國內(nèi)外主流AI芯片等舉措極大推動了有效訓(xùn)練時間的進步。同時,針對大模型的推理速度問題,諸如模型壓縮以及模型蒸餾技術(shù)的出現(xiàn)實現(xiàn)了減小模型大小和計算需求的目標,并從而提高模型的部署速度和實時性能。類似技術(shù)將不斷互相補充,相關(guān)技術(shù)創(chuàng)新將進一步促進大語言模型發(fā)展。
四、跨模態(tài)大模型深入發(fā)展
伴隨計算機視覺、語音識別等技術(shù)的不斷發(fā)展,跨模態(tài)大模型也逐漸成為研究熱點。這類模型能夠處理不同模態(tài)的數(shù)據(jù)(如文本、圖像、語音等),實現(xiàn)多模態(tài)信息的融合和交互,為人工智能應(yīng)用提供了更加豐富的可能性。相關(guān)企業(yè)包含具備云計算與技術(shù)積累的互聯(lián)網(wǎng)大廠以及AI1.0時代的科技公司。對于前者,諸如騰訊、百度以及阿里云,分別在CogView2、M6以及ERINE 4.0模型上實現(xiàn)特定任務(wù)的突破性進展,展現(xiàn)了在文本與圖像生成方面的創(chuàng)新潛力。針對后者,商湯繼承CV方面的優(yōu)勢發(fā)布了日日新大模型,云知聲延續(xù)其在語言方面的優(yōu)勢,發(fā)布山海大模型進一步開拓醫(yī)療問診的具體應(yīng)用。
五、產(chǎn)業(yè)化商業(yè)化加速
隨著大模型技術(shù)的不斷成熟和應(yīng)用場景的擴展,產(chǎn)業(yè)化和商業(yè)化進程不斷加速。其一,越來越多的企業(yè)將大模型技術(shù)應(yīng)用于實際業(yè)務(wù)中,推動了人工智能技術(shù)的落地和普及。大模型廠商中,對比Open AI在11月召開的首屆開發(fā)者大會中連續(xù)推出GPTs與Assistant API,百度發(fā)布了App Builder,旨在簡化大模型應(yīng)用的開發(fā)流程。App Builder平臺提供了一系列核心組件,例如原子化構(gòu)件、RAG(檢索生成增強框架)以及Agent機制,并以完整模版和框架的形式向開發(fā)者提供以促進開發(fā)效率。其二,國內(nèi)也涌現(xiàn)出一批專注于大模型技術(shù)研發(fā)和應(yīng)用的創(chuàng)業(yè)公司,為大模型產(chǎn)業(yè)的發(fā)展注入了新的活力。例如3月,百度推出全球首個企業(yè)級一站式大模型平臺千帆;10月,阿里云發(fā)布了阿里云百煉大模型服務(wù)平臺。國內(nèi)大模型領(lǐng)域商業(yè)化的加速為產(chǎn)業(yè)發(fā)展注入全新活力。
2023年對于國內(nèi)大語言模型發(fā)展而言,是一個充滿活力和變革的一年。從模型的規(guī)模化、多樣化的應(yīng)用場景、先進的技術(shù)創(chuàng)新,到跨模態(tài)大模型的深入發(fā)展,再到產(chǎn)業(yè)化和商業(yè)化的快速推進,這些趨勢和成果不僅體現(xiàn)了中國在人工智能領(lǐng)域取得的巨大進步,也預(yù)示著未來大模型技術(shù)將在更多領(lǐng)域展現(xiàn)其獨特的價值和能力。在國家政策的指導(dǎo)和市場需求的雙重推動下,中國的AI企業(yè)和研究機構(gòu)正迅速適應(yīng)和引領(lǐng)人工智能的新浪潮。展望未來,隨著技術(shù)的不斷進步和更深層次的跨行業(yè)融合,我們有理由相信大語言模型將在推動社會發(fā)展和創(chuàng)新各個方面扮演更加關(guān)鍵的角色。本系列文章將繼續(xù)介紹中美大模型發(fā)展差異,在對比中明確自身發(fā)展瓶頸并嘗試給出對策建議。歡迎廣大讀者持續(xù)關(guān)注并批評指正。
本文僅代表作者觀點。
- 1Fardior燃氣灶售后維修電話號碼查詢(Fardior燃氣灶售后維修電話查詢)
- 2ENS指紋鎖售后熱線(ENS指紋鎖售后熱線-專業(yè)解決您的問題)
- 3開利多聯(lián)機E1故章代碼(開利多聯(lián)機E1故障排查與維修指南)
- 4柯豐防盜門售后服務(wù)熱線(柯豐防盜門售后服務(wù)熱線全方位解決您的問題)
- 5格力3p天花機故障代碼(解讀格力3P天花機故障代碼)
- 6冰箱太干燥(該怎么辦?)
- 7廈門松下空調(diào)24小時服務(wù)電話(如何快速聯(lián)系客服解決問題)
- 8西安威能壁掛爐官方售后(如何快速聯(lián)系客服)
- 9海口惠而浦熱水器官方售后(如何聯(lián)系客服并解決常見問題)
- 10春韶指紋鎖售后維修(春韶指紋鎖維修中心)
-
南昌沃爾堡壁掛爐售后電話(如何快速找到并聯(lián)系售后服務(wù))
2024-09-11