Minimax:目標(biāo)將大模型幻覺率降低至3%,拒絕“重復(fù)造輪子”

在大模型如火如荼地發(fā)展一年后,外界眼中火熱的AI行業(yè)究竟現(xiàn)狀如何?未來將走向何方?
“目前大模型還在快速迭代階段,我們還沒有看到上限。”12月4日,上海AI獨(dú)角獸企業(yè)稀宇科技(MiniMax)副總裁劉華在接受澎湃新聞?dòng)浾卟稍L時(shí)坦言,“我們沒感覺到Scaling Law(尺度定律)放緩,也不同意大模型在技術(shù)上正在面臨天花板?!?
MiniMax成立于2021年12月,旗下具備文本、語音、音樂、圖像和視頻等多模態(tài)大模型。一個(gè)值得關(guān)注的亮點(diǎn)是,在AI出海方面,MiniMax走在了國(guó)內(nèi)最前列。最新數(shù)據(jù)顯示,MiniMax旗下海螺AI海外版登頂10月AI產(chǎn)品全球增速榜,月訪問量達(dá)1173萬,同比增長(zhǎng)高達(dá)2772.92%。
“我們從去年就開始開拓海外市場(chǎng),中國(guó)有自己的工程師紅利,也對(duì)產(chǎn)品有更好的理解。在堅(jiān)持技術(shù)驅(qū)動(dòng)的發(fā)展戰(zhàn)略下,和海外AI企業(yè)相比,我們的迭代速度更快?!闭劦匠龊3晒Φ男牡?,劉華坦言。
在他看來,美國(guó)在AI大模型技術(shù)方面整體處于領(lǐng)先地位,而在語音、文字等細(xì)分領(lǐng)域,中國(guó)大模型追趕速度很快,例如海螺AI和快手旗下的可靈大模型等都在美國(guó)有廣泛應(yīng)用,目前在這些領(lǐng)域,兩國(guó)技術(shù)水平已達(dá)到不相伯仲的階段。
今年大模型從一開始的熱潮涌動(dòng),又逐漸歸于冷靜,對(duì)于融資、變現(xiàn)、落地等話題的討論始終在持續(xù)。MiniMax如何看待今年AI行業(yè)的整體發(fā)展?
“我們并沒有觀察到AI行業(yè)存在泡沫。”劉華表示,此前很多企業(yè)競(jìng)相入局基礎(chǔ)大模型,開啟“百模大戰(zhàn)”,確實(shí)在一定程度造成了資源浪費(fèi)和“重復(fù)造輪子”,“行業(yè)的資源應(yīng)該得到有效分配,有實(shí)力做好基礎(chǔ)大模型的企業(yè)并不多。更多企業(yè)適合開發(fā)的是AI應(yīng)用,術(shù)業(yè)有專攻?!?
據(jù)他披露, MiniMax的長(zhǎng)期目標(biāo),首先是提升大模型實(shí)用性和滲透率,同時(shí)也要降低錯(cuò)誤率。上一代ChatGPT系列模型普遍存在“幻覺”,錯(cuò)誤率達(dá)到30%左右,導(dǎo)致在嚴(yán)肅生產(chǎn)場(chǎng)合無法使用,更多應(yīng)用在文創(chuàng)領(lǐng)域。如果要讓大模型進(jìn)入嚴(yán)肅的生產(chǎn)、研發(fā)、科研、設(shè)計(jì),就要進(jìn)一步降低錯(cuò)誤率,“我們的目標(biāo)是把錯(cuò)誤率從30%降低至2%-3%,為此一直在進(jìn)行各種模型迭代。”
此外,實(shí)現(xiàn)無限長(zhǎng)的輸入和輸出。從文本進(jìn)化到語音和視頻,大模型技術(shù)的進(jìn)化需要更多的數(shù)據(jù)處理量。劉華告訴記者,目前MiniMax最新研發(fā)的,基于MoE + Linear Attention架構(gòu)的abab 7大模型,使得長(zhǎng)文本處理效率不斷提高,比起傳統(tǒng)架構(gòu)有顯著優(yōu)化。
第三個(gè)目標(biāo)是堅(jiān)持多模態(tài)。未來大模型將從純文本走向多模態(tài),必然兼具文本、語音、視覺等多重功能。MiniMax將在海螺AI等應(yīng)用上提供更豐富的功能,為藝術(shù)創(chuàng)作持續(xù)賦能,包括后續(xù)會(huì)提升AI視頻生成的時(shí)長(zhǎng),這是重要的努力方向之一。
另一個(gè)業(yè)內(nèi)關(guān)注的話題是大模型卷“投流”帶來的高額廣告支出,部分大模型公司動(dòng)輒投入高達(dá)幾千萬甚至上億的廣告投放費(fèi)用,引起人們關(guān)注。對(duì)此,劉華表示,單純以擴(kuò)大用戶總規(guī)模為目的的投流價(jià)值不大,“對(duì)大模型的研發(fā)來說,最重要的是到底有多少用戶能夠留下,高頻使用大模型,這才是最大的價(jià)值。”
“如果一味依賴于投流,帶來的最大問題就是客戶黏性和留存度較差?!眲⑷A坦言,這也意味著對(duì)于大模型行業(yè)而言,單純卷投放沒有意義,還是要依靠扎實(shí)的技術(shù)吸引更多的用戶。
算力是大模型發(fā)展不可或缺的要素,大模型需要處理海量的數(shù)據(jù),并且需要在短時(shí)間內(nèi)完成復(fù)雜的計(jì)算任務(wù),這就意味著需要更高的計(jì)算能力,也離不開云計(jì)算廠商的支持。
三年前,MiniMax 就與騰訊云建立合作關(guān)系?!霸缙贏I企業(yè)的需求可能只有幾百卡、幾千卡,現(xiàn)在普遍達(dá)到上萬卡,后續(xù)會(huì)有更大規(guī)模的需求。”騰訊云北區(qū)云原生總經(jīng)理田豐告訴澎湃新聞?dòng)浾?,“算力上的考?yàn)對(duì)于云服務(wù)商的組網(wǎng)能力和集群運(yùn)維能力都會(huì)成為非常巨大的挑戰(zhàn),騰訊云為MiniMax 提供了一系列集計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)為一體的高性能智算產(chǎn)品,讓 MiniMax釋放更多的精力聚焦在模型本身的訓(xùn)練和工程化上?!?
例如,騰訊云高性能計(jì)算集群通過系統(tǒng)化的運(yùn)維機(jī)制,可做到網(wǎng)絡(luò)故障一分鐘內(nèi)發(fā)現(xiàn)問題,三分鐘內(nèi)定位問題,最快五分鐘恢復(fù)系統(tǒng)。其千卡集群的日故障數(shù)已刷新至 0.16,是行業(yè)平均水平的三分之一。騰訊云星脈網(wǎng)絡(luò),可實(shí)現(xiàn)大模型訓(xùn)練過程中,網(wǎng)絡(luò)通信占比(通信時(shí)間占總體時(shí)間比例)低至6%,整體訓(xùn)練效率提升了 20% 以上。
不過,田豐直言,并不是所有的大模型訓(xùn)練廠商都需要1萬卡或是幾萬卡這樣超大的算力集群,并且大集群不等于大算力,智能算力存在比較典型的木桶短板效應(yīng),需要不斷調(diào)整GPU資源利用率和集群通信效能,才能真正優(yōu)化算力的利用率。
“對(duì)于AI大模型的發(fā)展,無論是創(chuàng)業(yè)者還是投資人,都要有充分的耐心和信心,看似炫酷的技術(shù),最終都要落實(shí)到商業(yè)化本身,才能走向盈利。想要指望大模型短期帶來很高價(jià)值的經(jīng)濟(jì)效益可能性并不大,目前仍處于長(zhǎng)跑的第一公里階段?!碧镓S表示。
澎湃新聞首席記者 范佳來
(本文來自澎湃新聞,更多原創(chuàng)資訊請(qǐng)下載“澎湃新聞”APP)
上一篇:三全路附近維修燃?xì)庠?如何找到可靠的維修服務(wù))。
下一篇:沒有了
- 朗利卡地暖售后維修電話是多少10-19
- 1艾菲特保險(xiǎn)柜怎么開鎖(艾菲特保險(xiǎn)柜解鎖技巧)
- 2DESSMANN指紋鎖售后客服電話-400全國(guó)免費(fèi)咨詢熱線(DESSMANN指紋鎖售后客服電話-4
- 3canon復(fù)印機(jī)維修代碼(Canon復(fù)印機(jī)維修代碼指南)
- 4液晶電視白屏故障圖解(液晶電視白屏故障:一圖了解解決方案)
- 5西屋空氣能售后服務(wù)官網(wǎng)熱線(西屋空調(diào)售后官網(wǎng)熱線服務(wù)專線)
- 6Tata防盜門400電話(400電話:Tata防盜門的服務(wù)熱線)
- 7BLACKSAILS智能鎖售后客服(BLACKSAILS智能鎖售后客服達(dá)人)
- 811300高頻頭能收什么臺(tái)(11300高頻頭臺(tái)收臺(tái)及所在頻段概述)
- 9大金廠家24小時(shí)服務(wù)熱線官網(wǎng)(大金空調(diào)制熱不好是什么原因大金空調(diào)制熱效果差
- 10盾安空調(diào)維修服務(wù)部(如何選擇合適的盾安空調(diào)維修服務(wù)部?這個(gè)標(biāo)題提出了一
-
Minimax:目標(biāo)將大模型幻覺率降低至3%,拒絕“重復(fù)造輪子”
2024-12-06
-
三全路附近維修燃?xì)庠?如何找到可靠的維修服務(wù))。
2024-12-06
-
萊梅德烤箱售后服務(wù)號(hào)碼
2024-12-06
-
MONOLITH冰箱售后24小時(shí)人工客服
2024-12-06
-
美菱集成灶售后服務(wù)號(hào)碼
2024-12-06