首款生成式AI移動芯片天璣9300:能跑330億參數大模型
機器之心報道
作者:澤南
AI 畫圖一秒生成,大語言模型一秒 20 token。
2023 年是生成式 AI 的元年,我們手上的移動設備也在加速進入大模型時代。
11 月 6 日晚,聯發科(MediaTek)正式發布了年度旗艦 SoC 天璣 9300,這款芯片通過 4+4 全大核的設計,在性能與能耗等方面,全面超越了安卓和蘋果競品。
更為值得關注的是,今年的旗艦芯片被定義為 5G 生成式 AI 移動芯片,提供了遠超以往的高智能、高性能、高能效、低功耗卓越特性。
天璣 9300 采用臺積電新一代 4nm 工藝,擁有 227 億個晶體管。為了提供生成式 AI 時代的算力需求,天璣 9300 上開創性地使用了「全大核」CPU 架構,包含 4 個 Cortex-X4 超大核,最高頻率可達 3.25GHz,以及 4 個主頻為 2.0GHz 的 Cortex-A720 大核,其峰值性能相較上一代提升 40%,同性能情況下功耗節省 33%。
這種架構在保證了工作速度快、效率高的同時具有省電的特性,無論在輕載還是重載應用場景中,都能降低功耗、延長續航時間。聯發科表示,天璣 9300 面向目前常用的視頻、直播、游戲等常見任務需求進行了優化,相比以往也更加適應折疊屏手機的多任務模式。
隨著芯片制程提升,晶體管正在不斷小型化,各種漏電問題成為摩爾定律發展的重大障礙。漏電意味著能量消耗的大幅增加,芯片也會面臨過熱甚至失效的問題。在這種情況下,小核心的功耗與大核心差距已越來越小。
據介紹,早在三年前聯發科就開始了全大核芯片形式的探索。現在,讓大核快速處理任務后進行較長時間的休眠,我們可以讓大核處理器反直覺地相比小核同類產品更加省電。另一方面,聯發科也加入了亂序執行(out-of-order)策略,進一步增加了應用執行的效率。
聯發科認為到明年,全大核的設計將成為業內的共識。
常規能力之外,聯發科本次著重升級了芯片的 AI 性能。天璣 9300 集成了 MediaTek 第七代 AI 處理器 APU 790,專為生成式 AI 而設計,其性能和能效相較上一代得到顯著提升,整數運算和浮點運算的性能是前一代的兩倍,功耗降低了 45%。
APU 790 內置了硬件級的生成式 AI 引擎,可實現更加高速且安全的邊緣 AI 計算,相比上代,它專門針對目前大語言模型常用的 Transformer 進行算子加速,大模型的處理速度是上一代的 8 倍。
當代流行的大語言模型(LLM),其主要核心網絡架構大多是由 transformer Block 組成的。相較于計算機視覺常見的 CNN 網絡,transformer 網絡以 Softmax+LayerNorm 算子作為核心,卷積算子較少,因此原先 AI 核心的加速機制并不適用。在第七代 APU 處理器上,聯發科著重優化 Softmax+LayerNorm 算子,提升了算力。
量化是目前優化 AI 推理的有效方式之一。基于億級參數大語言模型特性,聯發科開發了混合精度 INT4 量化技術,結合其特有的內存硬件壓縮技術 NeuroPilot Compression,可以更高效地利用內存帶寬,大幅減少 AI 大模型對終端內存的占用。
聯發科的工程師表示,雖然大模型可以帶來更好的生產力,但本地運行 13B 的體量就意味著需要占用約 13GB 的內存,再加上安卓本身的 4GB,其他 APP 的 6GB,已經超過了大多數手機 16G 的內存容量。天璣 9300 使用的內存硬件壓縮技術,通過量化和壓縮把大模型的內存占用降低到了 5GB,只有這樣才能讓大多數用戶在日常跑得起大模型應用。
APU 790 還支持生成式 AI 模型端側「技能擴充」技術 NeuroPilot Fusion,可以基于基礎大模型持續在端側進行低秩自適應(LoRA,Low-Rank Adaptation)融合,進而賦予基礎大模型更加全面的能力。
基于這樣的硬件和優化,天璣 9300 在蘇黎世聯邦理工提出的 AI Benchmark 最新版本上可以達到 2019 分,是移動芯片的新高。
使用天璣 9300,端側的 AI 圖片生成如 Stable Diffusion 可以做到一秒以內出圖,70 億參數大語言模型的端側推理可以做到每秒 20token。
聯發科表示在與 vivo 的合作中,基于天璣 9300 已經率先實現了 7B 和 13B 大模型在移動端的推理,預計不久之后在終端就可以看到這樣的產品推向市場。另外在更極限的情況下,聯發科還跑通了高達 33B 的大模型。
在發布之前的溝通會和現場,聯發科展示了使用天璣 9300 工程機實現的 LoRA 文生圖、大模型生成文字等能力。
我們可以預見,在最新一代旗艦手機上,我們可以用上更聰明的智能助手,根據大模型給出的建議快速回復聊天和右鍵,用 AI 生成的表情包斗圖……
馬上就會推出且人人都可以體驗到的,就是 vivo X100 系列手機上 OriginOS 4 系統里的 AI 助理藍心小 V。
本月初,vivo 剛在開發者大會上介紹了藍心大模型及其應用,這一系列能力顯然是面向手機的。在大模型的加持下,藍心小 V 擁有行業領先的智慧,它可以通過語音、文字、文件拖拽等方式接收信息進行處理。如果遇到簡單的問題,小 V 會以文字或圖片進行回復。面對復雜的問題,它還可以通過 SWOT 模型或思維導圖的形式輸出回答。
此外,天璣 9300 的 AI 能力還覆蓋從搜索到拍攝。
聯發科表示,其 AI 開發平臺 NeuroPilot 已經對安卓、LIama 2、文心一言、百川大模型等前沿主流 AI 大模型進行了深度適配和優化,更多應用也在路上。
GPU 方面,天璣 9300 采用了 12 核心的 Immortalis-G720。與上代相比峰值性能提升 46%,相同性能下功耗可節省 40%。天璣 9300 搭載 MediaTek 第二代硬件光線追蹤引擎,支持 60FPS 高流暢度的光線追蹤,并帶來游戲主機級的全局光照特效。
此外,MediaTek 特有的 MAGT 游戲自適應調控技術升級為「星速引擎」,不僅與游戲應用廣泛合作,還將拓展更多類型應用的生態合作。在活動中,聯發科宣布天璣 9300 平臺將首發《仙劍世界》光追版,同時也將在手游《暗區突圍》上實現穩定 60 幀光追的體驗。
目前根據很多第三方評測,天璣 9300 工程機的 CPU、GPU 絕對性能和功耗比均超過了驍龍 8Gen3 與 A17Pro,看起來使用全大核的策略是成功的。
圖片來源:極客灣 Geekerwan
在其他方面,天璣 9300 也進行了全面升級,其 ISP 升級到了 Imagiq 990,支持 AI 語意分割視頻引擎、16 層圖像語意分割、景深和光斑雙引擎、全像素對焦疊加 2 倍無損變焦、OIS 光學防抖專核、3 麥克風高動態錄音降噪,可過濾 25km/h 風速的 99% 以上風噪。
天璣 9300 還配備了新的安全啟動芯片、隔離的安全計算環境和 Armv9 的內存標記擴展,可幫助開發人員避免內存漏洞利用。
網絡方面,天璣 9300 集成了 5G 調制解調器支持 Sub-6GHz 四載波聚合(4CC-CA)和多制式雙卡雙通,也通過 AI 算法提升信號,支持 5G 情境感知功能。天璣 9300 支持 Wi-Fi 7 和 5G sub-6GHz 頻段,下行鏈路速率達到 7Gbps。在藍牙連接方面,天璣 9300 支持 3 個藍牙天線、特有雙路藍牙閃連技術,可以帶來超低時延的藍牙音頻體驗。
據介紹,首款采用天璣 9300 芯片的手機包含 vivo、OPPO、小米、傳音等。在聯發科的發布活動后,vivo 已宣布即將在 11 月 13 日發布的 X100 系列中率先搭載新旗艦芯片,并第一個實現 LPDDR5T-9600 內存的落地。
我們期待新一代產品的問世。
- 怎樣拆洗電冰箱部件(詳細步驟教程)10-15
- 田熱水器故障代碼(如何解讀并排除故障)。05-12
- 小天鵝冰箱修理圖(如何自行維修)10-11
-
SINKO空調移機售后電話(如何獲取SINKO空調移機售后電話及了解相關服務流程?
2024-08-27
-
全球首套1-1復刻!黑悟空戰甲亮相大足石刻
2024-08-27
-
ROYAL空調售后服務(如何充分利用ROYAL空調售后服務以提升用戶體驗和滿意度?
2024-08-27
-
A股午前跌幅略有擴大,五大銀行股股價再創新高
2024-08-27