英偉達“春晚”上菜!RTX 40系顯卡發布,再次刷新科技極限
又到換顯卡的時候了——如果平臺有貨、你還有腎的話……
當地時間9月20日,英偉達在 GTC 顯卡技術大會上,終于發布了萬眾期盼的 RTX 40 系列顯卡。其中 4090 起步價就高達1599美 元(¥11200+)。
RTX 4090 渲染圖 圖片來源:英偉達
這個價格,難怪發布會后,網友惡搞的圖就紛紛上線……
圖片來源:LTT
除了 40 系列顯卡之外,同場發布的,還有英偉達在圖形計算架構、游戲開發、AI 加速、工業元宇宙、云計算、量子計算等方面的新產品、技術、最新進展。
它們包括(并不限于):
- 全新 GPU 架構 Ada Lovelace,安培 (Ampere) 架構的升級版,也是40系列顯卡性能巨大提升的功臣;
- RTX Remix,一個游戲 mod 開發工具,能夠為幾乎任何3D游戲添加光追效果
- “核彈”H100 AI 加速 GPU,已經全面啟動生產,即將發貨;
- “雷神”(Thor) 超級計算機,整合 Grace(CPU)、Ada(GPU)、 Hopper (AI加速計算)三大能力,適用汽車、醫療、工業等領域。以汽車為例,單機即可撐起整個自動駕駛系統+車機+車載娛樂系統;
- Omniverse Cloud 服務,能夠連接幾乎所有主流大型3D工業/設計應用的云端基礎設施(IaaS),讓元宇宙開發可以在多端任何設備之間無縫工作;
- Nemo LLM 系列,一個超大規模神經網絡開發工具,能夠顯著加速大規模神經網絡模型的訓練、調優和推理等,包括面向自然語言、生物制藥等多個場景的子服務。
其中,最新的 Ada Lovelace 架構,可以說是絕大多數新產品和技術突破的背后功臣。這是英偉達推出的全新 GPU 架構。主要特性為第三代 RT Core 光追核心,吞吐量為前代兩倍;第四代 Tensor Core 張量核心,張量矩陣計算性能為前代兩倍;Ada 架構的 CUDA 核心,顯著提高AI 加速,以及3D圖形計算的性能。
架構來自于“史上第一段電腦程序”的作者,英國數學家艾達·勒芙蕾絲伯爵夫人 圖片來源:英偉達
接下來,一起來看這一屆英偉達“春晚”,都給大家送上了哪些硬菜。
RTX 4090 & 4080黃仁勛老板手里拿的這張是英偉達自己的 RTX 4090 Founders Edition(16GB),采用了以往創始人版本基本相同的外殼設計:
RTX 4090 圖片來源:英偉達
目前從華碩、七彩虹等合作伙伴那邊看到的首批 4090 和 4080 顯卡設計普遍采用全尺寸、三風扇、3-slot 厚度:
ROG Strix RTX 4090 圖片來源:華碩 ROG
Vulcan RTX 4090 圖片來源:七彩虹
RTX 40 系列顯卡是:
- 英偉達最新推出的 Ada Lovelace 架構的第一款顯卡,
- 采用了最新版 DLSS 3 深度學習超級采樣技術、
- 著色器 Shader 執行重新排序 (SER) 技術、
- Ada 光流加速器、
- 第八代英偉達雙AV1編碼器、
- 24GB GDDR6X 顯存
在游戲性能方面,40 系列最大的性能提升來自于最新版 DLSS 3 技術。
DLSS (Deep Learning Super Sampling,深度學習超級采樣)能夠調取低分辨率的當前幀和高分辨率的上一幀,使用卷積神經網絡 (CNN) 自動編碼技術來提前預測出高分辨率的當前幀。
DLSS 3 的最大突破,在于在深度學習超分辨率技術的基礎上,增加了光學多幀生成能力,并且集成了英偉達開發的高速低延遲向量計算技術 Reflex。
DLSS 3 采用的 CNN 自動編碼器能夠接受4個輸入:當前幀、上一幀、Ada 光流加速器生成的光流場數據,以及運動矢量+深度等游戲引擎數據。
最厲害的地方在于 Ada 光流加速器:它能夠分析兩個連續幀,捕捉導粒子、光照、反射、陰影等不包含在游戲運動矢量引擎計算當中的信息,捕捉這些像素在兩幀之間移動的方向和速度,從而獨立計算出一個光流場。
Ada 光流場圖示 圖片來源:英偉達
結果就是,從這些數據輸入當中,DLSS 3 能夠精確計算并重建出當前幀的四分之三,外加下一幀的全部,總體重建了總顯示像素的八分之七。這樣能夠極大地提高了游戲幀率和圖形質量,進一步降低傳統渲染方式對 GPU 和 CPU 造成的負載。
DLSS 3 技術圖解 圖片來源:英偉達
再加上全新的 Shader 執行重新排序 (SER) 技術,和 CPU 的亂序執行一樣,是計算技術領域的重大創新,能夠通過動態重新調度 shader 負載,更好地利用 GPU 內的各項資源,將光追性能提高三倍,提升25%左右的幀率
英偉達也找到波蘭蠢驢合作開發了一個《賽博朋克2077》的光追過載模式,顯示在 RTX 4090 顯卡上打開 DLSS 3 之后圖像輸出延遲降低了一半多,幀率提升了四倍,總體性能提升約為4倍。這個模式回頭也會推送給 PC 版玩家,在 40 系列顯卡上可以打開。
視頻加載中...
視頻來源:CD Projekt Red、英偉達
除了《賽博朋克2077》之外,包括《微軟模擬飛行》、新哈利波特游戲、《黑神話:悟空》等在內的30多款游戲,也都將原生支持 DLSS 3 技術:
圖片來源:英偉達
你的游戲沒在列表里?沒關系。
為了向游戲愛好者群體里的圖形增強 Mod(模組)開發者致敬,英偉達還推出一個模組開發平臺,名為 RTX Remix。
RTX Remix 圖示 圖片來源:英偉達
一邊玩游戲,一邊打開這個工具,它能夠錄制游戲場景數據,直接從 GPU 里攔截渲染指令,包括紋理、幾何體、照明數據和鏡頭位置等,將它們轉換為通用場景描述(Universal Scene Description, USD)。
然后,再運用多項技術對其自動增強紋理,甚至可以讓一些“上古”時代、不支持光追的32位游戲,實現光追和 DLSS 3 支持。
最后,RTX Remix 可以把這些增強結果打包生成為一個游戲 Mod 文件——結果就是,也許大家不用成天上 Nexus Mods 下圖形增強模組了,因為有了 RTX Remix,任何人理論上都可以成為模組開發者,自己動手增強自己的游戲體驗!
為了更直接地展示 RTX Remix 的能力,英偉達和水管公司合作開發了一個原版《傳送門》+RTX 強化版 DLC,畫面質量和光影效果有了巨大提升(見下圖右)
Portal RTX DLC 圖片來源:英偉達、Valve
總體上,RTX 4090 目前已知只有24GB顯存一種配置。在開啟了 DLSS 3 時,其在光追游戲中的性能比上一代采用 DLSS 2 的 3090 Ti 顯卡快4倍,總體游戲性能提升約為2倍,并且功耗維持在相同的450W。
RTX 4080 有12和16GB顯存兩種配置,總體游戲性能提升為 3080 Ti 的兩倍,在 DLSS 3 開啟時性能足以超過 3090 Ti。
游戲說完,再來簡單看一下創作者方面:在3D 渲染、視頻導出,以及 AI 相關任務方面,RTX 4090 的性能比 3090 Ti 快兩倍,4080 16GB 版本則比 3080 Ti 快1.5倍。
RTX 4090 起價1599美元,10月12日面市;4080 兩種配置都在今年11月上市,起價分別為899和1199美元。
不少朋友可能在不久前加密礦難的時候,才剛剛入手價格正常的30系列顯卡……如果你也是這樣,那么接下來的消息可能會讓你些許悲傷:30系列顯卡的英偉達指導價格也有所下調,比目前市價普遍低了50美元左右……
圖片來源:英偉達
當然,新品發布也少不了吐槽。
華碩板卡的官方圖,Mini-ITX 主板+4090,已經不是顯卡插在主板上了,而是主板插在顯卡上……
圖片來源:華碩
還有網友說,跟去年這個“泄露”版4090 相比,大小似乎沒差多少……
圖片來源:Captains Workspace
另外值得一提的是,就在上周末,全球最大的板卡廠商之一,曾被稱為英偉達“親兒子”的 EVGA,突然正式宣布了和英偉達終止合作關系。盡管該公司已經完成了測試產品開發,量產已經做好準備,卻明確表示將不會生產和銷售 EVGA 品牌的40系列顯卡,30系列存量僅用于售后服務,并且完全退出顯卡市場……
至于原因,EVGA 指責英偉達拿自己當小弟、當炮灰,不僅不及時提供產品技術和市場相關信息,還用低價 founders edition 顯卡打擊合作伙伴的銷售,一度逼得 EVGA、華碩等板卡廠商下調價格。
毫無疑問的是,英偉達一邊繼續在顯卡技術上做出大跨步式的創新,另一邊由于自己的技術和市場領袖地位,確實在板卡合作方那邊顯得傲慢至極——不只是 EVGA 一家,其它廠商都有相同感受,只是沒有像它這么堅決而已。
“雷神”車載超級計算機大家應該知道,隨著近十年來 GPU 技術驅動的深度學習突飛猛進,英偉達早已不再是純粹的傳統消費顯卡廠商,也已成為了工業級 AI 加速計算方面的技術領導者。
在今天的 GTC 大會上,英偉發布了 DRIVE Thor,一臺只靠單機架構,就能夠運行自動駕駛+數字儀表盤/車機+車載信息娛樂一整套系統的車規超級計算機:
DRIVE Thor 圖片來源:英偉達
“雷神”超級計算機,可以說是英偉達三大 AI 加速計算架構技術之集大成:Grace CPU、Ada Lovelace 架構 GPU,以及 Hopper 多實例 GPU 架構。它的總體浮點運算性能高達2000萬億次 (TFlops),比前不久剛剛實現商用的前代平臺 DRIVE Orin ,算力實現了驚人的八倍提升。
這次升級的另一大亮點,在于英偉達首次在面向自動駕駛場景開發的車載計算機 DRIVE 平臺中,增加了 Transformer(一種主流的深度學習模型)模型的支持。
Transformer 引擎在“雷神” GPU 單元的 H100 Tensor Core 中運行,依靠 FP8(8位浮點)精度,它能夠直接在車載計算機上運行包括 Transformer 在內的更大規模的機器學習模型,從視頻當中截取感知幀,極大提升了車載算力的性能,降低了對云端服務器和連通性的要求。
黃仁勛在 GTC 演講中演示了一段視頻,顯示“雷神”可以只靠自己就運行一輛自動駕駛汽車完整的運行、感知、決策、避讓等操作,以及環境實時掃描和數據搜集等任務。
DRIVE Thor roadmap 圖片來源:英偉達
“雷神”的另一個特性在于具備多域計算 (multi-domain computing) 能力,滿足車規級硬件的要求。
在汽車行業,車機、自動/輔助駕駛系統對于穩定性安全性較高,而車載信息娛樂系統沒有那么高。過去,這些不同類型和安全級別的功能需要數十個 ECU(可以理解為獨立的小電腦)來控制。
而“雷神”可以在系統層面對不同任務進行多域隔離,使得諸如自動/輔助駕駛、車機儀表、安全氣囊等關鍵進程能夠不間斷的進行。
一臺“雷神”上可以同時運行 QNX(主要用于車規級系統和功能)、Linux 和 Android(更多用于信息娛樂等非關鍵系統)。
圖片來源:英偉達
目前,包括小鵬 (Xpeng)、吉利極氪 (Zeekr)、輕舟 (Qcraft) 等在內的一些國內新能源/新造車品牌和自動駕駛技術開發者,已經和英偉達達成合作關系,對“雷神”進行早期測試。
英偉達估計“雷神”系統將在2024年進入量產,極氪 CEO 安聰慧透露將在2025年生產的下一代智能電動汽車當中采用該系統。
正如歷年來英偉達的產品發布會和技術峰會一般,本屆 GTC 也是發布種類繁多、信息量巨大且密集。
除了我們剛剛介紹的 RTX 40系列顯卡和“雷神”車載超算之外,英偉達還推出了依賴最新 Ada Lovelace 架構 GPU 的云計算服務、邊緣計算平臺、工業園元宇宙開發環境 Omniverse Cloud、面向大語言/蛋白質折疊模型優化的加速計算工具和服務等,礙于篇幅限制,在此就不詳述,感興趣的朋友可以訪問英偉達官網 newsroom 查看。
*注:封面圖來自于英偉達,版權屬于原作者。
- 佳麗彩遙控器代碼(如何設置和更改)04-27
- 酒柜可以放客廳嗎(如何選擇合適的位置)?08-29
- 冰箱銅管腐蝕(如何預防和處理)05-06
- 帝度洗衣機武漢維修(帝度洗衣機售后電話)08-19
-
GEA空調廠家售后服務電話號碼是多少(如何獲取GEA空調廠家的售后服務電話號碼
2024-08-24
-
DATAAIRE空調清洗(如何正確清洗DATAAIRE空調以保持其性能和延長使用壽命?)
2024-08-24
-
雷諾威空調24小時服務熱線電話(如何聯系雷諾威空調24小時服務熱線以解決我的
2024-08-24
-
櫻雪點火故障(解決櫻雪點火故障的實用方法與步驟)
2024-08-24
-
RC空調24小時熱線(RC空調24小時熱線:全天候客戶支持與故障排除指南)
2024-08-24