2023科創圓桌對話:AI大模型的產業應用與數字安全
1956年人工智能的概念被首次提出,直到去年ChatGPT出現,各行各業大談大模型,人工智能才更廣泛地在各種層面的應用中出現在人們的生活里。一方面人工智能重塑各行各業,另一方面也帶來了隱私保護、儲存安全等問題。
10月25日,由澎湃新聞和上海漕河涇新興技術開發區聯合主辦,上海人工智能研究院學術支持的科創先鋒論壇以“大模型與數字治理”為主題在漕河涇會議中心成功召開。在圓桌沙龍環節,圍繞“AI大模型的產業應用與數字安全”這一話題,澎湃新聞內容風控首席運營官孫光海與上海市計算機軟件評測重點實驗室副主任,研究員陳敏剛、螞蟻財富保險事業群首席技術架構師曹剛以及智己汽車副CTO郭輝展開了精彩對話,分享了大模型在城市治理、金融、自動駕駛以及傳媒領域的應用。
左起:澎湃新聞內容風控首席運營官孫光海、上海市計算機軟件評測重點實驗室副主任,研究員陳敏剛、螞蟻財富保險事業群首席技術架構師曹剛、智己汽車副CTO郭輝
以下為對話實錄,略有刪減:
大模型何為“大”?
上海市計算機軟件評測重點實驗室副主任,研究員 陳敏剛
陳敏剛:大模型的大主要表現是模型參數規模非常大。在學術界有個規律,當模型參數量達一定規模會出現“智能的涌現”,也就是說只有參數規模足夠大,才會執行復雜的推理。此外,訓練數據量很大。據了解,維基百科的語料只占到ChatGPT訓練語料的約3%。最后,需要用到的算力非常大。據OpenAI的聲稱,GPT-3的一次訓練,單次大約需要450萬美元。
但是我覺得最本質的是應用范圍很大。大模型擁有很好的泛化能力。以前人工智能都是弱人工智能或者是窄人工智能,一個應用就需要開發一個模型。但是在大模型時代,人類可以通過一些提示工程(Prompt)快速地去泛化到下游的各類任務,一站式地解決各類任務。所以我覺得大模型為未來產業可能帶來最大的變革,就在于它這種對于各種場景的泛化和適配的能力。
螞蟻財富保險事業群首席技術架構師 曹剛
曹剛:我理解大模型的“大”是,對人工智能產業技術的影響非常大。類似像ChatGPT這樣一個“殺手級”應用,基本上花2個多月時間就可以做到1億的MAU(月活躍用戶數量)。而國內,以大家用得最多的抖音為例,差不多要花9個月的時間。
螞蟻集團今年也制定了集團的三大戰略,其中之一是AI-First。我們不能把AI技術僅僅視作拓覆蓋、提效率的錦上添花的能力,而是用AI-First這種理念指導業務的生產,重塑整個業務的鏈條,推進業務走向下一個階段。
大模型在不同行業正在解決什么問題?
陳敏剛:首先談到城市治理這個話題,前幾年非常火的一個概念叫做“智慧城市”,有些地方也稱為“城市大腦”。城市大腦、智慧城市的目標就是要實現城市的數字化轉型,提升城市治理的體系和治理的現代化。因為這一段時間ChatGPT實在太火,好像把智慧城市、城市大腦的聲音給淹沒了。在我看來大模型是可以對現有的城市大腦做一次升級,下面我舉幾個例子。
首先,政務大模型。比如說像政務咨詢,如果有了大模型,我們可以更加準確地去理解用戶辦事要求,甚至可以引導用戶說出他真正想要辦的業務。
另外城市大腦有一個很重要的應用,是要用AI感知城市發生各種的事件,快速做處置和處理。以前在大模型沒有出現之前,可能每一個具體的視覺場景,比如占道經營,就需要一個視覺的模型去發現這些不合適的場景。未來我們有了多模態大模型以后,是否有機會讓一個大模型去解決掉我們城市感知的各個問題?用一個大模型可能就可以解決掉違法占道、違法停車、交通違法、道路積水等所有長尾的場景。
第三,OpenAI近期提供了一個很強大的插件,原來叫代碼解釋器,現在更新成Advanced-Data-Analysis插件,可以快速自動化地、用人機交互的方式去做數據分析。有這樣的工具后,我們在城市治理的場景下,可以快速對城市發生的各種采集數據進行精準、快速、高效的處理,然后來輔助我們政府的決策。
曹剛:螞蟻集團一直都深耕在金融領域。就現在而言,我們理財和保險領域核心是把大模型用在兩個方面:第一個,用戶體驗的提升;第二個,提效業務生產鏈路。
首先講講用戶體驗的提升。我們之前發布了支小寶的2.0,是一個個人理財助理,同時也是保險助理,你在上面可以通過問答的方式問一些關于理財保險的知識。通過大模型的技術進行產品升級,整個問答端的準確率可以得到大幅提升,目前能夠達到95%以上。
在生產力提升方面,我們發布了支小助1.0,這是一個針對金融從業者的業務專家助手,類似于微軟的Copilot。在金融領域,我們的服務鏈條非常縱深,涉及許多業務專家。我們使用大模型的技術來重塑傳統工作流程,讓支小助成為一個大模型驅動的產品,從而顯著提高整個業務專家和金融從業者的效率。
舉例來說,我們為理財師的顧問團隊和保險代理人團隊提供了一個支小助的服務版,通過大模型的加持,我們的團隊管理范圍的服務人數提升了70%以上。另外,在營銷領域,我們使用大模型技術生產文案、圖片和視頻等創意,讓有限的產品上疊加無限的創意,從而顯著提升業務轉化效果。在保險領域的理賠問題上,我們通過大模型的技術實現了圖像信息提取和推理技術的聯合,形成了全自動化的能力,大大縮短了用戶理賠的時間。
智己汽車副CTO 郭輝
郭輝:我分享一下在汽車領域大模型應用的狀態。大模型會大大提升我們在自動駕駛領域里面人工智能模型的迭代速度。首先大模型在云端有非常豐富的參數,能夠幫助我們進行相應的仿真測試,在有足夠豐富數據輸入前提下,我們可以使用大模型訓練小模型,部署在車端,大大提升我們在車端運行小模型的迭代效率。其次是大家熟悉的智艙。在與人類的交互過程當中,我們在車上更多是使用語音的交互功能,怎么樣更好識別人的意圖,能夠給人提供準確的內容,這是我們在落地實現的。
澎湃新聞內容風控首席運營官 孫光海
孫光海:澎湃新聞在內部也進行了AI繪畫、AI寫作、AI審核三方面的探討。尤其是我在跟其他新聞網站同行交流,我說澎湃新聞每天發布400多條的原創稿件,每篇稿件都要配插圖、配圖。如果AI技術發展到一定程度,可以通過AI生成圖片來節省相關的運營成本,減輕美編的工作負擔。
在AI協作方面,我們在智能跟評方面也在做內部的測試,更為成熟的一點是內容安全這方面。比方說現在大家看到APP有些突然下架了,訪問有一個欄目突然停更了,這些情況十有八九是內容合規方面導致的。澎湃新聞開發了澎湃清穹服務,正式對外為黨政、媒體、國有企業、資訊平臺服務,目前的效果還是不錯的,尤其是在社政領域。
具體到場景,大模型如何提升?
曹剛:通用大模型在金融領域要落地是一個非常復雜的系統工程,起碼要解決三個挑戰。
首先,通用大模型對金融領域的認知有短板。比如,我能不能買到一個保本保息高收益的產品?實際上在市場上這種產品基本上不存在,因為這都是有嚴格的金融監管以及金融的體系來維護的,所以我們需要對它進行專業的金融通識相關的訓練,甚至我們自己場景對于金融業務的理解也需要讓它訓練起來,灌入到它整個知識結構當中。
第二個挑戰,在金融領域其實有很多推理和決策的內容,最簡單的:你到底要不要買這個股票?這涉及大的推理過程和決策過程,這是目前我們看到通用大模型很難直接給出答案的。
第三,整個金融因為是非常嚴謹的,具有很強的量化數字的屬性,我們知道往往通用大模型比較擅長文科相關的工作,對于數字計算、復雜的量化計算這部分能力還是比較欠缺的。加上金融領域合規性要求非常高,一個投資者過來到底能買什么產品,不能買什么產品,起碼得遵守合格投資者的管理辦法才能把合格的產品推薦給他,這些通用大模型基本上很難做到。
郭輝:汽車領域來看,我們解決兩類問題,一類是成本和效率的問題,就是在云端的大模型,包括它的訓練,以及最終部署到服務器,甚至我們把它進行裁剪,最后放到車端整個代價是什么?
第二是解決時延的問題,哪怕今天的網絡條件,也總有連不上網的時候。連不上網怎么滿足智能駕駛安全方面的需求?大模型+小模型并行的方式,我們在探索這個方向。
數據安全如何保障?
曹剛:國家層面其實已經看到這樣的問題,此前出臺的《生成式人工智能管理辦法》一定程度上就是為了規避這些問題。就螞蟻集團而言,我們是一家科技公司,底層積累了非常多的數據,個人安全和隱私保護,我們集團層面一直非常重視這個問題。所以從數據的采集、加工、傳輸、存儲,集團有專門的部門進行管理,有相應的數據分級分類以及一些各類管理機制以及規范。
陳敏剛:數據泄露是一個重要問題,大模型存在Prompt攻擊的漏洞,攻擊者可以通過輸入特定提示繞過安全機制引導大模型說出有害內容。
此外,大模型應用中存在幻覺問題,即輸出的信息在語義、語法上可能是正確的,但具有誤導性、錯誤性或矛盾性。我們團隊的測試結果顯示,ChatGPT4在幻覺輸出概率上達到30%,國內大模型這一數據超過50%。這樣一些現象,就提醒我們在大模型真正應用落地的時候要注意非常的小心。
郭輝:汽車行業兩大類的安全,一類我們叫功能安全,另外一類叫信息安全。在功能安全方面,汽車廠商需要確保硬件、軟件和模型的冗余設計,以防止單點失效導致人身安全的威脅。而對于人工智能模型的安全性保證,需要建立一個可解釋的、規則明確的安全框架來兜底。此外,在開發流程中還需要進行針對人工智能的對抗性訓練,包括對抗樣本生成等,以增強模型的魯棒性和安全性。
而在信息安全方面,汽車行業需要從設計系統本身的防護能力、整體的安全架構以及失效后的檢測和防護機制等方面進行考慮,以保障網絡和數據的安全。此外,還需要進行利民攻擊測試以及隱私安全保護,包括最小化數據采集和確保數據安全合規的要求。
算力的提升對不同場景有何影響?
曹剛:國家在基礎算力方面布局是非常好的事情。首先,基礎算力基礎設施的布局有助于解決技術卡脖子的問題。螞蟻金融大模型底座是跑在萬卡的異構集群上面的。實際上萬卡里面絕大部分的GPU卡資源都是采購于英偉達,只有少部分是采購國產的GPU資源。所以公共算力資源的布局,有利于讓更多的企業能夠進來,降低了準入門檻。整個產業活躍度起來后,真正受益的應該是終端消費者。只有這樣,我們有很多的想法才能滿足。
郭輝:我補充另外一個經濟性維度。第一,國產化相應大算力的芯片有助于良性的市場競爭,使得最后我們消費者能夠享受到普惠。第二,我們從行業的應用來看,不同公司波峰和波谷一定存在不均勻的情況,如果可以消除波峰波谷,就像電力一樣,我相信各個行業都能夠獲益。
陳敏剛:算力提升會加速通用大模型商業化的應用。其次,會加速我們垂直領域大模型的研究和應用的落地和大模型深度應用。什么叫深度應用?前面我也提到了OpenAI開放了很多的插件,這些插件可以幫助你快速去交互式分析大規模的數據,這就是深度應用。深度應用肯定需要用到大量的算力。同時,未來如果算力足夠,大模型和我們具身智能相結合,可能會推動像人形機器人非常前沿技術的快速應用和落地。
孫光海:我們有一種說法,人工智能1.0如果說是相當于發明了電,那人工智能3.0在AIGC大模型這樣的情況下相當于一張電網。從短期來看AIGC改變了基礎生產力的一個工具,有些說中期來看改變了社會生產關系,長遠來看改變了社會生產力。我們也希望AI+時代會有更驚艷的商業創新和商業模式,助力我們的生活更加美好。
- 夏普20818L代碼F2(如何解決故障)05-05
-
美的電磁爐eb什么故障(標題:美的電磁爐EB故障解決方案:診斷與修復步驟陳述
2024-08-25
-
AERMEC空調維修服務部(如何利用AERMEC空調維修服務部解決空調問題?)
2024-08-25
-
Hidros空調廠家保養加氟(如何正確進行Hidros空調廠家的保養和加氟服務?)
2024-08-25
-
CITEC空調廠家售后網點(如何找到CITEC空調廠家的官方售后維修服務網點?)
2024-08-25
-
有圖像無伴音故障部件(解決有圖像無伴音故障的部件問題:一步步排查與修復
2024-08-25