谷歌發布大模型,國內“百模大戰”鏖戰正酣
圖片來源@視覺中國
文|趣解商業,作者 | 周佟
2022年底,OpenAI發布ChatGPT掀起了人工智能熱浪,時隔一年后,谷歌終于“殺回”人工智能賽道。
當地時間,12月6日,谷歌正式發布了Gemini大模型。谷歌CEO桑達爾·皮查伊稱,Gemini的發布,是谷歌新時代的開始;但人們最關注的問題還是Gemini和GPT-4相比水平誰更高。
谷歌公司高管稱,三種不同版本的套件中的Gemini Pro,表現優于GPT-3.5,但暫未直接回應Gemini與GPT-4相比表現如何的問題。不過外界有測評認為,它們已經超過了GPT-4。
圖片來源:微博截圖
不管是否超過,作為大模型的“風向標”,由一年前推出的ChatGPT引發的“生成式人工智能”革命,仍在不斷地改寫著每個人的認知。
如今巨頭谷歌已“上線”,過去一年,在ChatGPT的引領下,國內的大模型企業也從摸索和嘗試,逐漸步入深水區。
“百模大戰”,從震驚到追趕ChatGPT的出現并非毫無征兆。
創造它的OpenAI早在2015年便已成立,并在2018年就推出了初代生成式預訓練模型GPT-1,這也是ChatGPT最初的原型。
公開資料顯示,在GPT-1之前,業內的NLP模型(Neuro logic level自然語言處理)主要是基于針對特定任務的大量標注數據進行訓練,能力有限。
GPT是第一個結合Transformer(多層變換器)結構和自監督預訓練目標的模型,在自然語言推理、問答任務和常識推理等方面取得了突破,為此它們也獲得了微軟10億美元投資。隨后,從GPT-1到GPT-2,到GPT-3,短短2年時間里GPT的能力不斷提高。
圖片來源:OpenAI官網截圖
2022年11月27日,隨著由GPT-3.5修改而來的人工智能對話聊天機器人ChatGPT的推出,這個一直在小圈子走紅的研究成果,才第一次為大眾所認識。能聊天、畫畫、寫文案、編代碼,強大的功能,使得ChatGPT一經發布迅速走紅,5天時間注冊用戶數超過百萬,兩個月時間月活突破1億,成為史上增長最快的消費者應用。
消息傳至國內,一石激起千層浪。人工智能竟然已經發展到如此地步了?震驚之下,淘寶上售賣ChatGPT賬號甚至都成了一門生意。與此同時,看到巨大商機的各界大佬們,也紛紛下場,表態要盡快推出自己的大模型。
率先落地的是百度。2023年3月16日,國內首個大語言模型“文心一言”問世,發布會上,百度CEO李彥宏直言,“生成式AI是任何企業都不應錯過的大機會”。
而百度之所以能夠拔得國內大語言模型的“頭籌”,源自其過去10多年中,在AI研發上的堅持投入。按李彥宏的說法,文心大模型的第一個版本早在2019年就發布了,此后每年都有更新,文心一言的發布只是百度多年努力的“自然延續”。
緊接著,3月29日,360集團發布人工智能戰略及360智腦大模型1.0版本,創始人周鴻祎現場演示了大模型在搜索場景的應用。4月11日,阿里巴巴的“通義千問”大模型在阿里云峰會上揭曉,CEO張勇宣布未來阿里巴巴所有產品都將接入“通義千問”。5月6日,科大訊飛星火大模型發布,董事長劉慶峰表態要在10月24日實現中文超過ChatGPT,英文趕上ChatGPT。9月7日,騰訊混元大模型上線。
至此,國內傳統的三大互聯網巨頭“BAT”全部下場。
此外,華為、京東、字節跳動、商湯科技、昆侖萬維等等都陸續推出了大模型產品,甚至連移動、聯通、電信三大運營商,長虹等家電生產企業,清華、復旦、中科院等科研院所和高校,都發布了各自的大模型。
5月底舉行的中關村論壇上,有專家披露,中國10億級參數規模以上大模型已發布了79個;在7月初的2023世界人工智能大會中有信息表明,中國已有130家研發大模型的公司。此時,ChatGPT引起的大模型研發熱,已經帶動國內形成“百模大戰”的格局。
不過相比當初外賣界的“百團大戰”,“百模大戰”對資金的需求更為苛刻。
根據NVIDIA官方信息,在訓練底層模型階段,訓練一次1750億參數的GPT-3需要34天、使用1024張A100 GPU芯片,而為了維持日常推理,OpenAI至少需要3.24萬張A100,以此推算,ChatGPT僅硬件成本就超過了8億美元。
昆侖萬維集團CEO方漢更是公開表示,“沒有2000張A100的卡,實驗都做不了”。為此,海天瑞聲、因賽集團等“AI概念股”甚至接連發布定增預案,募集資金用于訓練大模型。
此時 ,如何在縮小與ChatGPT差距的同時,盡快找到應用落地的方向,實現自我造血,成為了“百模大戰”中,每一位參與者都要面對的問題。
人工智能+將所有行業做一遍?從商業角度分析,大模型帶來的機遇,可以概括為成本減少效率提升、原有市場需求再擴大、創造新的市場需求三大類。
在今年8月31日、11月4日,根據網信辦《生成式人工智能服務管理辦法(征求意見稿)》的要求,國內先后有兩批涉及26家公司的AI大模型和151個深度合成服務算法通過備案,陸續向全社會開放服務,其中的商業化嘗試,也基本是圍繞這三類展開的。
圖片來源:網信辦截圖
大模型超強的人機對話、圖文及音視頻生成能力,不但讓其在傳統客服場景中獲得了廣泛應用,對于游戲、影視制作等也產生了深遠影響。
阿里、美團的在線智能客服算法,以及中國移動的“九天大模型”、中國電信的TeleChat大模型等,都屬于此類產品,將應用場景直接鎖定在了智能客服、智慧政務等方面。在今年的亞運會上,科大訊飛與中國移動聯合推出了基于星火大模型的5G新通話,接完電話之后,申請服務,會即刻轉成文字、生成紀要、生成待辦事項。
游戲、影視制作方面,導演陸川曾在采訪時表示,“用AI畫電影海報,15秒出來的效果比專業海報公司做一個月的還要好。”光線傳媒、華策影視等率先嘗試將大模型應用在影視創作中的公司,股價在年中都收獲了一波大漲。
原有市場需求再擴大,則體現在對于傳統業務的升級上,這也是大模型應用最廣泛的領域。以傳統的搜索引擎為例,接入文心一言后,在百度搜索框里輸入問題,給出的可以不再是鏈接,而是一個更準確的答案。
10月17日,文心一言4.0發布,根據李彥宏現場的演示,除了搜索外,百度地圖、網盤、文庫等十余款應用,都接入文心一言完成了重構。
旗下業務眾多的騰訊,對騰訊云、騰訊廣告、騰訊游戲、騰訊會議等多個業務和產品,也已完成了接入騰訊混元大模型的測試,并取得了初步效果。
圖片來源:騰訊混元官網截圖
此外,在傳統的教育、醫療、汽車等領域,大模型也獲得了廣泛的應用。接入訊飛星火大模型后,科大訊飛的學習機實現了AI一對一輔助教學、中英文作文批改、口語陪練等功能;百度推出了產業級的醫療行業大模型“靈醫”,有超過1000家企業級機構先行體驗;華為云盤古大模型的賦能,則讓問界新M7在智能駕駛領域“遙遙領先”,兩個月大定突破10萬臺。
在創造新的市場需求方面,AI超級助理、AI機器人等需求也被不斷創造出來。前者,包括文心一言、訊飛星火、360智腦、通義千問等在內的各家通用大模型都有相應產品提供,它們大都能理解用戶的語言語義,并具備圖像理解能力,可以通過調用軟件API,使用各種各樣的工具來幫助用戶完成任務;而后者,在今年8月16日舉行的2023世界機器人大會上,包括優必選、追覓、宇樹在內的不少于 10 家機器人企業,展出了相關產品,賽道也正呈現井噴態勢。
圖片來源:通義官網截圖
不過,在一片欣欣向榮背后,也存在隱憂。比照各家大模型的應用不難發現,不管是提高效率還是擴大需求,市場上絕大多數的應用,實現的功能都較為雷同。
以AI學習機為例,除了科大訊飛有相關產品外,接入子曰大模型的網易有道、接入MathGPT的好未來、接入銀河大模型的作業幫,以及接入文心一言的百度、接入360智腦的360,都有類似的產品在售。功能方面,各自宣傳的也都大同小異,AI一對一輔導、全科AI作業助手、虛擬人口語教練等,站在消費者的角度,幾乎很難體會到其中的差別。
盡管各家都能拿出一堆的排名榜單來論證,自己的大模型得分更高、能力更強,但體現在實際應用中時,那百分之幾甚至是千分之幾的差別,還是讓人不得不產生疑惑:我們真的需要這么多大模型嗎?
AI原生應用至上,亟待“安卓”出現對于大模型步入“深水區”將會遇到的挑戰,百度創始人、董事長兼首席執行官李彥宏提出了自己的看法。
近期,在深圳2023西麗湖論壇開幕式上,李彥宏就直言,擁抱AI時代,是“一把手工程”。因為CTO、IT負責人更關注技術本身,認為自己做大模型是交作業,結果不僅資源浪費,而且用不起來,最后一地雞毛;只有一把手才會真的關注,新技術如何提升自己業務的關鍵指標,一把手上陣,才能讓新技術真正為企業所用。
不斷地重復開發基礎大模型是對社會資源的極大浪費。在李彥宏看來,國內如今的大模型實在是太多了。根據統計,截止10月份,國內已經發布的大模型達到了238個,比5月科技部統計時的79個,翻了三倍,但與此同時,市場上真正的AI原生應用卻很難找出幾個。一把手應該主導做AI原生應用,而不是大模型。
圖片來源:微博截圖
“人類進入AI時代的標志,不是產生很多的大模型,而是產生很多的AI原生應用。”李彥宏認為,大模型時代其實和PC時代、移動互聯網時代極為類似。PC時代,主流的操作系統只有Windows一個,移動互聯網時代,也基本只有安卓和iOS兩家,然而圍繞著它們,誕生了無數的應用軟件。
大模型本身也屬于基礎底座,類似操作系統,最終開發者要依賴為數不多的大模型來開發出各種各樣的原生應用。“AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。”
這確實是國內的大模型玩家們不得不面對的難題。盡管市場上大模型產品有幾百個,但細究起來都是在各玩各的,360智腦只為自家搜索賦能,訊飛星火此前主要是為科大訊飛的學習機產品服務。
相比大模型訓練的高額花費,如果不能夠有效擴大“朋友圈”,讓自家的大模型為更多人所用,只是一味投入,顯然難以為繼。
上半年大漲的AI概念股們,下半年幾乎集體熄火,與此不無關系。科大訊飛(002230.SZ)10月19日發布的三季報顯示,前三季度實現營業收入126億元,同比下滑0.27%,凈利潤9936萬元,同比跌了76%。根據公告,其利潤下滑的主要原因,就是源自對大模型的“堅定投入”。
圖片來源:財報截圖
三六零(601360.SH)的情況也沒有好多少,上半年盡管新興業務“360智腦”創造了近2000萬元營收,但在9.1億元的總收入中,占比不過2.1%。
在“百模大戰”進入深水區后,如何圍繞各自的大模型,“擴大朋友圈”創造生態,爭取更多的開發者,成了國內通用大模型玩家們不約而同的選擇。
在1024開發者節上,科大訊飛董事長劉慶峰透露,除了聯合相關企業發布了包含金融、汽車、住建、法律等在內的12個行業大模型外,在訊飛星火上,已有1.5萬助手開發者,開發了超過2.9萬個助手應用。
百度則先后推出了“百度智能云千帆大模型平臺”、“靈境矩陣”,幫助企業開發自己的專屬大模型,目前平臺月活企業數已近萬家。
阿里巴巴旗下的通義千問,從18億、70億、140億到720億參數規模,率先成為業界首個“全尺寸開源”的大模型,以吸引更多合作伙伴加入,共促通義千問生態建設。
去年11月,阿里巴巴發布AI開源社區“魔搭”,中國80%的大模型研發機構把魔搭作為模型開源的首發平臺。短短一年時間,魔搭匯聚了280萬開發者、2300多個優質模型,模型下載量超過1億。
正如中國科學院院士、中國計算機學會(CCF)開源發展委員會主任王懷民所說,開源是AI發展的重要驅動力,AI開源社區不僅將有力推動AI邁向廣泛的落地應用,還將助力中國從開源世界的參與者逐步成長為引領者。
大模型行業的未來,如智能手機系統的迭代。曾經,除了蘋果的iOS外,手機操作系統中還有諾基亞的Symbian、微軟的Windows Phone、黑莓的BlackBerry,但是最終它們無一例外都敗給了“在2012年,就擁有10萬開發者,超過40萬活躍應用”的Android。
期待國產大模型們,早日跑出本賽道的“Android”。
- 編程的魅力(編程魔力:探索無限可能)02-14
- 1海信42k11p怎么折開(海信42K11P:全方位展示超清畫質)
- 2創維液晶電視的遙控器怎么調試(創維電視遙控器調試指南)
- 3林內空氣能售后服務官網熱線(林內空氣能售后服務官網熱線)
- 4朝友精工保險柜24小時售后電話(朝友精工保險柜24小時售后電話 - 完善24小時保
- 5納斯普金保險柜24小時售后電話(如何快速打開保險柜鎖的方法)
- 6冰箱溫控器接錯線(如何正確接線避免損壞)
- 7空調f8是什么故障(空調F8故障解析)
- 8福田松下空調維修電話(如何快速聯系客服解決問題)
- 9施樂燈架位置故障如何解決(施樂燈架位置故障的解決策略:一步步排查與修復
- 10TCL空調廠家售后電話24小時人工電話(TCL空調24小時客服熱線:全天候為您的空調
-
上海中科萬隆空調售后服務電話(中央空調清洗如何收費標準)
2024-09-11
-
美的中央空調廠家24小時人工客服(美的空調在什么情況下出水量多美的空調出水
2024-09-11
-
特靈空調廠家售后電話24小時聯系方式(特靈空調上的五條線怎么接線詳細圖文教
2024-09-11
-
廈門歐利時ORLEXI燃氣灶售后故障報修中心(燃氣灶滅火斷氣壞了如何維修)
2024-09-11
-
開利廠家維修號碼(開利空調開機后又自動關機怎么回事如何快速解決)
2024-09-11