像“拼樂高”一樣做芯片?從Intel Meteor Lake架構(gòu),看Intel如何延續(xù)摩爾定律
“集成電路上可以容納的晶體管數(shù)目在大約每經(jīng)過18個月到24個月便會增加一倍。換言之,處理器的性能大約每兩年翻一倍,同時價格下降為之前的一半。”這段話出自“英特爾三位一體傳奇”的戈登摩爾,而他的這段“摩爾定律”已經(jīng)是家喻戶曉了,但隨著晶體管微型化變得越來越困難,雖然近十幾年來CPU和GPU的性能確實能做到兩年左右提升一倍,但晶體管密度和能耗比要分別花費三年多與四年才能達(dá)到摩爾定律的目標(biāo),摩爾定律沒有消失,它仍然存在,可速度已然慢慢放緩了。
作為摩爾定律堅定的追隨者和踐行者,英特爾現(xiàn)任CEO Pat Gelsinger不止一次公開宣稱“我們”會繼續(xù)做摩爾定律的守護(hù)者,摩爾定律活著并且活得很好(Moore’s Law Alive and Well)。哪怕是另一家半導(dǎo)體巨頭Nvidia的CEO黃仁勛宣布摩爾定律已死,作為原教旨主義者的基辛格也堅持站隊他的老前輩戈登摩爾。
我們從看似不可能的“四年五節(jié)點”計劃和混合架構(gòu)的引入都不難看出,Pat Gelsinger對于踐行摩爾定律并不只是口頭上說說而已,而從Intel目前制程節(jié)點的進(jìn)度來看,四年五節(jié)點的計劃正在正常推進(jìn)。
為了達(dá)到業(yè)界內(nèi)普遍不看好的摩爾定律,Pat Gelsinger自然深諳老前輩的教導(dǎo),早在1965年,摩爾在一篇論文張就指出:構(gòu)建大型系統(tǒng)時,將其分解為單獨封裝并互連的較小功能可能更經(jīng)濟(jì),這是摩爾從芯片封裝技術(shù)的角度去考量芯片能耗比與經(jīng)濟(jì)比,而此次英特爾全新的Meteor Lake架構(gòu)便是從這句話開始的。
從PCH封裝技術(shù)可同時封裝芯片組,到采用了量產(chǎn)2.5D封裝技術(shù)EMIB(嵌入式多芯片互聯(lián)橋接)的數(shù)據(jù)中心、服務(wù)器CPU Sapphire Rapids,再到即將推出的、采用了3D Foveros從而達(dá)到分離式模塊化設(shè)計的Meteor Lake,英特爾的創(chuàng)新型封裝技術(shù)在業(yè)界保持領(lǐng)先水準(zhǔn),為摩爾定律的延續(xù)提供了強有力的支持。
簡單點來講,就是將CPU中各個功能分區(qū)模塊化,根據(jù)目標(biāo)需求,再將不同的模塊組合在一起,而每個模塊中又有不同的功分區(qū),將這些模塊排列組合,就和拼接樂高那樣,把需要東西放上去,給予設(shè)計非常大的靈活性,想增加什么功能就增加什么功能,想增強什么功能就增強什么。此次MTL的目標(biāo)為PC史上出色的高能效平臺、加速人工智能普及、以及全新的Intel 4工藝為CPU核心性能以及集成顯卡的性能帶來提升。
我們可以看到下圖左側(cè),這是MTL架構(gòu)的一張示意圖,本代的MTL共擁有四個模塊(Tile):
最上面的為圖形模塊Graphics Tile;
中間的為專門為低功耗表現(xiàn)所打造的SoC Tile,這是MTL中是最大的創(chuàng)新點,我們將重點解析這個模塊;
左下角為控制接口的IO Tile;
右下角為高性能計算的Compute Tile,P核和E核位于此。
了解了這四個模塊,我來分別講解一下這些模塊有什么用,有什么創(chuàng)新,以及會對我們普通用戶的使用帶來什么影響。
SoC Tile中集成了諸多的功能,下圖中間藍(lán)色框內(nèi)就是SoC Tile中集成的所有功能,這里來說幾個關(guān)鍵點:LP E-Cores、Media媒體引擎,Display顯示功能、以及IOC控制模塊。
看到這個E-Core,大家可能聯(lián)想到自12代酷睿開始混合架構(gòu)中的E-Core,但其實不然,這次的MTL除了在Compute Tile中的高性能核心與高效能核心外,在SoC Tile中還集成了兩個LP E-Core即Low Power E-Core,低功耗能效核,組成了大核心+小核心+超小核心的高能效3D混合架構(gòu),以后我們在計算MTL的核心數(shù)量時還要計入LPE核心,這點大家需要注意。并且非常不能忽視的一點是,LP E-Core是位于SoC Tile的,而不是Compute Tile。
如此一來,在一些非常低負(fù)載的任務(wù)中,直接調(diào)用LP E-Core就可以完成,而這些負(fù)責(zé)低負(fù)載任務(wù)的功能區(qū)也基本都設(shè)計進(jìn)了SoC Tile,例如媒體引擎、控制各種接口、Wifi等的IOC和非常重要的內(nèi)存控制器等等,他們之間由極低功耗、極低延遲的NOC總線進(jìn)行連接,可以直接訪問內(nèi)存控制器。這些低負(fù)載的任務(wù)根本不需要“驚擾”到Compute Tile,由LP E-Core就可以完成計算,這就是本代MTL做到低功耗與高能效比的底層思路——很多小任務(wù)之前都需要激活E核心或P核心來處理,MTL的架構(gòu)改變使得這些任務(wù)都交給這兩個迷你核心完成了,傳統(tǒng)意義上的CPU核心都在睡大覺,功耗肯定就低了,這部分模塊也被很形象的稱為“Low Power Island”即“低功耗島”。
LP E-Core可以講是MTL架構(gòu)的核心,也是SoC Tile的核心。
媒體引擎與顯示引擎按照我們的思維慣例,應(yīng)該是處于GPU中的,但MTL創(chuàng)新式的將這兩部分功能加入進(jìn)了SoC Tile中,這就帶來了兩個最直接的好處。
首先,看視頻、視頻通話等“視頻”相關(guān)的功能,是大部分用戶在使用筆記本電腦時相當(dāng)常用的功能,在之前,傳統(tǒng)的CPU架構(gòu)需要連通CPU核心、GPU核心再連接到內(nèi)存控制器,也就是說整個CPU幾乎都需要通電才能完成這個任務(wù),例如下圖所示,消耗自然就比較大了。
而MTL便無需如此,媒體引擎和顯示引擎被單獨拿出來放到了SoC Tile中,而SoC Tile中又有著LP E-Core這種超低功耗核心,也就是說,在視頻任務(wù)方面,只需要SoC Tile便可以消化完畢了,根本無需在圖形處理模塊Graphics Tile與計算模塊Compute Tile中通電,大大降低了功耗,這是MTL非常有針對性的一大改變。
本次的媒體引擎依舊強大,尤其在編解碼的硬件支持上還是保持著領(lǐng)先地位,例如:可以硬件層面編解碼HEVC格式、10bit色深、4:2:2采樣的視頻,作為對比,售價高達(dá)12999+的消費級頂端獨立顯卡Nvidia RTX 4090不支持該視頻格式下的硬件編解碼。另外在顯示引擎方面,支持HDMI2.1、DP2.1,支持一個8K 60Hz HDR顯示器或同時連接四個4K 60Hz HDR顯示器。
與媒體引擎同理的還有IOC,Wi-Fi、藍(lán)牙、USB、PCIe等等交由IOC統(tǒng)一調(diào)配后再交給LP E-Core處理。
當(dāng)下,AI方面的應(yīng)用可以講是風(fēng)光無限,英特爾自然不會錯過這個機遇,除了傳統(tǒng)的CPU和GPU外,英特爾MTL中還有專門用于AI計算的NPU引擎,為PC帶來更強的AI能效,使得個人用戶無需付出高昂的代價便可完成AI任務(wù),加速普及AI。
本次MTL中的NPU集成了兩塊神經(jīng)計算引擎,由推理管道和可編程數(shù)字信號處理器組成,其中推理管道擁有更高效與靈活的矩陣乘法和卷積,支持了FP精度下多種函數(shù)、量化網(wǎng)絡(luò)的數(shù)據(jù)類型轉(zhuǎn)化和融合操作、輸出數(shù)據(jù)的重新布局;每個神經(jīng)計算引擎包含兩個超長指令字?jǐn)?shù)字信號處理器,為高吞吐量激活函數(shù)提供增強的浮點向量指令,支持lnt4到FP32數(shù)據(jù)類型。
此外還有DMA引擎和暫用內(nèi)存,可將數(shù)據(jù)引入軟件管理的SRAM,圖形編輯器會優(yōu)化調(diào)度DMA任務(wù),支持先進(jìn)的數(shù)據(jù)重新布局。
對于目前常見的AI應(yīng)用、大模型庫例如Stable Diffusion,NPU都可提供強勁的性能支持,另外在能耗方面,NPU同樣也設(shè)置在了SoC Tile中,這樣一來,類似于背景虛化、人眼角度矯正等功能便可在SoC Tile中完成了,提高了筆記本電腦的續(xù)航能力。獨立的NPU使得MTL在AI方面的整體能效提升了8倍。
三、Graphics Tile與Compute Tile——性能與能耗兼得
分離式模塊化架構(gòu)讓MTL的設(shè)計可以“既要有要”了,SoC Tile注重能耗比方面,而Compute Tile和Graphics Tile則可以專注于性能提升。
對于Compute Tile和Graphics Tile,這次媒體會中Intel放出的信息并不多,我們目前已知的信息為Compute Tile中是首次基于Intel 4制程工藝的核心,性能核心為Redwood Cove微架構(gòu),能效核心為Crestmont微架構(gòu),旗艦型號可能為6個P核+8個E核+2個LPE核的規(guī)格。
Graphics Tile則會升級為全新的Xe LPG架構(gòu),自9代酷睿開始,到11代酷睿再到上代的Xe LP微架構(gòu)集顯,每次都有兩倍的性能提升,Intel近幾年又在獨立顯卡方面汲取了大量的經(jīng)驗與技術(shù)積累,本次的Xe LPG就是在Arc獨立顯卡的Xe HPG微架構(gòu)改進(jìn)而來,性能會比當(dāng)前的Xe LP微架構(gòu)提升較多。
由于將媒體引擎和顯示引擎移至了SoC Tile中,所以Graphics Tile理論上允許堆料的空間更大了,本次的MTL的集顯將最高擁有8個Xe核心,也就是128EU,相比于Xe LP時期的96EU,規(guī)模提升了,架構(gòu)也提升了。同時,本次MTL中集顯還支持DX 12 Ultimate,擁有8個光追單元,在性能、硬件支持方面將會迎來比較大的提升。
線程調(diào)度是自12代酷睿引入大小核架構(gòu)之后的“難題”了,任務(wù)是由E核心運行以保證能效,還是需由P核心運行來達(dá)到更好的性能表現(xiàn),這就是大小核心架構(gòu)下的線程調(diào)度問題。在12代酷睿初期,不僅僅是普通的用戶在抱怨調(diào)度問題,很多軟件的開發(fā)者也經(jīng)常抱怨軟件在調(diào)度方面的的優(yōu)化比較困難。
不過經(jīng)過多次的迭代、軟件的更新以及Win11系統(tǒng)的更新,目前的調(diào)度問題已經(jīng)優(yōu)化提升的非常不錯了,而到了MTL之后,雖然是再次引入了全新的架構(gòu),但英特爾可能不會再犯12代酷睿時有些“趕鴨子上架”的錯誤了,全新的英特爾硬件調(diào)度器整裝待發(fā)。
Intel與微軟合作,在Windows系統(tǒng)層級進(jìn)行了優(yōu)化,本次英特爾硬件調(diào)度器并不是直接把任務(wù)分配核心,而是加入了一層根據(jù)核心狀態(tài)時時更新的“評分系統(tǒng)”,更加精準(zhǔn)的為操作系統(tǒng)報告準(zhǔn)確的能力評估,從而進(jìn)行線程調(diào)度。那么這套系統(tǒng)是怎么做到的呢?
首先每個任務(wù)將分為4個等級,分別為Class 0~Class 4。
Class 0代表著P核心和E核心在執(zhí)行這個任務(wù)時每時鐘執(zhí)行指令數(shù)量基本一致;
Class 1代表著P核心比E核心在執(zhí)行這個任務(wù)時每時鐘執(zhí)行指令數(shù)量多;
Class 2代表著P核心比E核心在執(zhí)行這個任務(wù)時每時鐘執(zhí)行指令數(shù)量明顯多;
Class 3代表著E核心比P核心在執(zhí)行這個任務(wù)時每時鐘執(zhí)行指令數(shù)量少。
在把任務(wù)分級之后,再根據(jù)每個核心當(dāng)下的狀態(tài)進(jìn)行打分,選出最適合執(zhí)行這個任務(wù)的核心,Windows就會把這個任務(wù)分配給該核心運行。
等于說,英特爾線程調(diào)度器將會具備兩個過程,一是任務(wù)評級,二是核心評分,雙重保障正確的核心用于正確的任務(wù),以達(dá)到更佳的性能狀態(tài),另外,這還有助于提升能效比,MTL能否達(dá)到更高的能效比,除了“低功耗島”的效果外,英特爾線程調(diào)度器也是至關(guān)重要的一點。
全新的先進(jìn)封裝方式,重塑了整個架構(gòu),讓芯片的設(shè)計更加靈活,使得Meteor Lake可以達(dá)到在性能和功耗方面的“既要又要”,就像拼樂高一樣,用戶需要什么就往上面加什么。獨特的低功耗島可以看到英特爾架構(gòu)師們的巧思妙想,短短兩代產(chǎn)品之后我們又看到了全新的設(shè)計思路,為消費級CPU再次帶來了變革。
LP E-core的加入,SoC Tile中的設(shè)計,獨立的NPU,全新的Intel 4工藝,Meteor Lake奠定了這之后英特爾CPU的架構(gòu)特點,加上英特爾在芯片領(lǐng)域多年的領(lǐng)先定位、重新奪回的制程優(yōu)勢以及對用戶側(cè)需求的深耕,Meteor Lake的實際表現(xiàn)將非常可期,繼續(xù)支撐摩爾定律向前發(fā)展。
最后,在發(fā)布日期方面,根據(jù)剛剛結(jié)束的Intel Innovation,Pat Gelsinger宣布Meteor Lake處理器將于今年的12月14日正式發(fā)布,個人預(yù)計明年年初將會有搭載Meteor Lake處理器的終端產(chǎn)品開售。
- 1大金冷氣故障代碼a3(大金冷氣故障代碼A3解析指南)
- 2空調(diào)繼電器壞了出現(xiàn)什么問題(如何判斷及更換)
- 3凱福將指紋鎖售后服務(wù)中心(凱福指紋鎖服務(wù)中心:專業(yè)售后服務(wù)一站解決)
- 4樂開指紋鎖售后電話(樂開指紋鎖售后電話:快速與貼心的服務(wù)!)
- 5步陽防盜門打不開怎么辦(步陽防盜門無法開啟應(yīng)對策略)
- 6創(chuàng)維G6圖像模式怎么調(diào)(創(chuàng)維G6圖像模式指南:如何實現(xiàn)最佳中心調(diào)節(jié)?)
- 7奧克斯柜機空調(diào)故障代碼e4(奧克斯柜機空調(diào)故障代碼e4:疑難排解及解決方案
- 8小米電視換屏幕多少錢(維修費用詳解)
- 9西門子洗衣機報e17故障(西門子洗衣機E17故障解決方案)
- 10十大不建議買的燃?xì)庠钆琶?哪些品牌不靠譜?)