AI+,需要什么樣的算力網(wǎng)絡?
來源:人民郵電報
AI+時代,算力將發(fā)揮越來越重要的作用,成為產(chǎn)業(yè)升級、生產(chǎn)力躍遷的關鍵驅動力。當前我國算力網(wǎng)絡正處于融合統(tǒng)一的攻堅期、泛在智能的躍升期、原創(chuàng)技術的突破期、產(chǎn)業(yè)生態(tài)的塑造期。為更好服務AI+時代,算網(wǎng)發(fā)展需要實現(xiàn)“三個質(zhì)變”——以“大規(guī)模智算集群”為核心,實現(xiàn)基礎設施的質(zhì)變;以“算網(wǎng)大腦智能升級”為核心,實現(xiàn)編排調(diào)度的質(zhì)變;以“融合統(tǒng)一算龍頭”為核心,實現(xiàn)服務模式的質(zhì)變。
如何實現(xiàn)這些目標,讓算力網(wǎng)絡全面支撐AI+?在2024中國移動算力網(wǎng)絡大會上,中國移動給出了自己的最新實踐以及規(guī)劃路徑。
構建大集群,打造AI模型訓練的超級工廠。中國移動將持續(xù)優(yōu)化算力網(wǎng)絡資源總體布局,面向AI+升級,今年將商用哈爾濱、呼和浩特、貴陽三個自主可控萬卡集群,總規(guī)模近6萬張GPU卡,充分滿足大模型集中訓練需求。隨著大模型訓練逐漸轉向大規(guī)模行業(yè)應用,泛在的推理需求持續(xù)涌現(xiàn),中國移動將按需在1500個邊緣節(jié)點部署推理算力,形成“中心大集群、邊緣廣分布、中訓邊推、訓推一體”的智算網(wǎng)絡。同時,還將持續(xù)完善技術體系,推進全棧技術創(chuàng)新。一是突破堵點,加快邁向超萬卡集群。面向機間互聯(lián),原創(chuàng)提出全調(diào)度以太技術體系(GSE),構建無阻塞、高帶寬、超低時延的新型智算中心網(wǎng)絡,對標國際主流的IB和UEC方案,形成中國自主的技術體系,今年將開展GSE中試,加速GSE關鍵技術和產(chǎn)業(yè)成熟;面向卡間互聯(lián),打造標準開放總線級互聯(lián)架構,提升GPU卡間高帶寬、低時延通信能力,實現(xiàn)互聯(lián)拓撲和協(xié)議的全棧級優(yōu)化,為標準開放的新型智算互聯(lián)貢獻中國方案。二是多元異構,構建融合開放的大算力生態(tài)。持續(xù)推進一云多芯的多樣算力,打破AI芯片生態(tài)豎井,今年將升級“芯合”算力原生平臺,支持智算應用在更多GPU芯片的快速遷移,同時還支持面向大模型的分布式異構混訓,打破當前大模型僅能在單廠家單型號集群訓練的局限。中國移動將進一步實現(xiàn)云底座關鍵技術突破,升級“大云天元”操作系統(tǒng),商用推廣云原生數(shù)據(jù)庫、新一代SDN網(wǎng)絡。三是訓推一體,打造開箱即用的AI服務。自研智算平臺,打造模型訓練“自動化生產(chǎn)線”,實現(xiàn)AI模型全生命周期服務,支持全棧、全自主可控、全地域的資源統(tǒng)一管理調(diào)度,提供一站式開發(fā)工具箱,支持萬卡并行訓練、千卡15天以上穩(wěn)定訓練、分鐘級斷點續(xù)訓,確保大模型訓得好、快、穩(wěn)。
暢通大動脈,構建AI數(shù)據(jù)流轉的信息高速路。面向近期,中國移動充分發(fā)揮網(wǎng)絡優(yōu)勢,加快打通國家樞紐集群間的400G高速互聯(lián)鏈路,開放網(wǎng)絡彈性能力,打造大帶寬、廣覆蓋、低時延、智能化的新型運力網(wǎng),進一步降低業(yè)務西遷成本,積極為國家樞紐節(jié)點內(nèi)、節(jié)點間公共傳輸通道貢獻力量。面向中長期,將主導形成“高通量、低時延、一體化”的多層次融合網(wǎng)絡方案。一是高通量,針對長距離網(wǎng)絡傳輸性能瓶頸,研發(fā)新型高吞吐傳輸協(xié)議,今年將與國家天文臺、華大基因等開展聯(lián)合驗證,實現(xiàn)長距離、高吞吐、高彈性、廣覆蓋和高安全的數(shù)據(jù)快遞服務;二是低時延,歷時五年,聯(lián)合產(chǎn)業(yè)攻關反諧振空芯光纖技術,設計自主結構,相比傳統(tǒng)實芯光纖傳輸時延降低33%,今年將啟動20公里中試驗證,明年預計突破100公里,有望改變光通信產(chǎn)業(yè)格局;三是一體化,依托中國移動在IETF主導的算力路由技術體系,在路由中引入算力向量,實現(xiàn)聯(lián)合優(yōu)化調(diào)度,樣機驗證顯示,業(yè)務平均時延降低15%,系統(tǒng)容量提升30%,今年將繼續(xù)推動算力路由原創(chuàng)技術標準化,與視頻監(jiān)控、云渲染等場景結合開展中試驗證。
建強大中樞,研發(fā)AI任務分發(fā)的最強大腦。算網(wǎng)大腦是基于網(wǎng)絡的分布式算力任務分發(fā)系統(tǒng),中國移動將在去年試商用的基礎上,實現(xiàn)全網(wǎng)調(diào)度能力和智能化水平的全面躍升。一是功能躍升,今年將納管自有智算中心、邊緣節(jié)點,廣泛吸納三方算力,實現(xiàn)通智邊一體調(diào)度和全局數(shù)據(jù)高效流通,開放算網(wǎng)能力超過3000個,多要素能力實現(xiàn)ABCDNETS全覆蓋;二是性能躍升,日調(diào)度次數(shù)從千萬次提升到億次,引入能效等更多維度,攻關解決高維組合優(yōu)化問題,基于新型的并行算法,加快實現(xiàn)分布式跨集群任務的調(diào)度;三是服務能力躍升,融合九天算網(wǎng)大模型,創(chuàng)新AI交互式訂購,實現(xiàn)個性化、智能化交互新模式,不斷賦能算網(wǎng)新服務,推動屬地化、單一式傳統(tǒng)產(chǎn)品向全局化、復合式產(chǎn)品升級。
塑造大產(chǎn)業(yè),繁榮AI應用創(chuàng)新的“熱帶雨林”。一是壯大創(chuàng)新根基,當前已經(jīng)初步構建了覆蓋國際、國內(nèi)的算力網(wǎng)絡標準體系,特別是在IETF成立的算力路由工作組,正在主導算網(wǎng)一體總體架構設計。未來中國移動將進一步健全標準體系,加快推動智算中心網(wǎng)絡等標準制定,為全球標準貢獻更多中國方案。二是繁茂創(chuàng)新枝葉,加快未來產(chǎn)業(yè)、創(chuàng)新聯(lián)合體打造,深化算力并網(wǎng)、任務式服務模式創(chuàng)新,激發(fā)AI+應用創(chuàng)新活力,完善商業(yè)模式。同時,中國移動正在加快構建集約高效的數(shù)聯(lián)網(wǎng),打造數(shù)據(jù)流通基礎設施,讓高質(zhì)量數(shù)據(jù)“活起來、動起來、用起來”,支撐數(shù)據(jù)要素全國統(tǒng)一大市場建設。到今年底,中國移動算力并網(wǎng)規(guī)模將突破5EFlops,算網(wǎng)服務樣板間超過80個,數(shù)聯(lián)網(wǎng)交易節(jié)點落地超10個。三是培育創(chuàng)新沃土,將以跨地域、跨主體的全國性算力網(wǎng)絡試驗科學裝置為基礎,聯(lián)合更多產(chǎn)學研合作伙伴,支撐建設全國一體化算力網(wǎng)原型試驗場,孵化更多算力網(wǎng)絡新技術、新應用。同時,中國移動作為國資央企,將發(fā)揮在智算資源、安全、運營等方面的優(yōu)勢,助力全社會方便、快捷地使用智算服務,打造一片AI創(chuàng)新的“熱帶雨林”。
- 佳源燃氣灶維修(如何自行解決常見故障)10-10
- 1容聲冰箱故障代碼f8(容聲冰箱故障代碼F8的原因及解決方法)
- 2佳家利保險柜售后服務中心(佳家利保險柜售后服務中心卓越服務)
- 3全自動洗衣機按鍵圖解(如何正確使用洗衣機)
- 4常州自來水24小時服務熱線(如何聯(lián)系并解決水務問題)
- 5tcl空調(diào)網(wǎng)怎么拆(tcl空調(diào)網(wǎng)拆解攻略)
- 6海爾熱水器故障代碼F9(解讀海爾熱水器故障代碼F9)
- 7星月神防盜門沒電打不開怎么辦(星月神防盜門沒電打不開怎么辦)
- 8熱水器10年以上不建議清洗(為什么?有哪些風險?)
- 9三星冰箱冷藏室風扇拆裝視頻(如何正確操作)
- 10東控防盜門24小時售后客服熱線(東控防盜門24小時售后客服熱線,您身邊的安心