隨著科技的發(fā)展,人工智能(AI)已經(jīng)逐漸滲透到我們生活的方方面面。從先進(jìn)的AI游戲到元宇宙的構(gòu)建,從自動(dòng)駕駛的實(shí)現(xiàn)到大數(shù)據(jù)中心的智能化運(yùn)營(yíng),再到像ChatGPT這樣的大型語言模型的訓(xùn)練和AI generated content(AIGC)的應(yīng)用,AI的應(yīng)用場(chǎng)景正在以前所未有的速度和廣度拓展開來。然而,這些應(yīng)用的實(shí)現(xiàn),都離不開強(qiáng)大的算力支持。
在PC時(shí)代,提升算力的的重點(diǎn)是提高CPU的主頻,于是雙核、多核異構(gòu)開始流行。從PC時(shí)代進(jìn)入到手機(jī)、平板等移動(dòng)終端時(shí)代,開始對(duì)于多媒體、圖形渲染提出了更高要求,于是GPU變得越來越重要。而相較于CPU,GPU的浮點(diǎn)運(yùn)算方式更加適合AI算法模型的計(jì)算。事實(shí)上,很多的AI應(yīng)用在早期的硬件基礎(chǔ)都是GPU,通過GPU來運(yùn)行多種通用的AI算法。
在早期的摩爾定律時(shí)代,AI普遍采用計(jì)算和存儲(chǔ)分離的馮諾依曼架構(gòu),特點(diǎn)是低算力、低能耗比。那時(shí)英特爾、AMD、 ARM為代表的CPU芯片是集成電路皇冠上的明珠。隨著GPU、AI加速芯片如NPU等處理器的出現(xiàn),后摩爾時(shí)代來臨,算力開始大幅度提升,但能耗比仍然較低。比如區(qū)塊鏈、數(shù)字貨幣的挖礦需求促進(jìn)了單一硬件加速器替代GPU。而到了今天,不管是自動(dòng)駕駛、元宇宙還是AIGC類應(yīng)用,使用GPU的成本已經(jīng)太高。AI廠商更傾向于自己設(shè)計(jì)ASIC芯片,采用專用的計(jì)算架構(gòu),可以帶來幾倍,甚至幾十倍數(shù)量級(jí)別的能耗比。
AI中的深度學(xué)習(xí)需強(qiáng)大的并行處理能力,因此,AI處理器主要集中在GPU、FPGA、ASIC和NPU等,廠商也都在研發(fā)和升級(jí)這些處理器應(yīng)對(duì)挑戰(zhàn)。其中,GPU是當(dāng)前最主要的AI處理器。2021年上半年,中國(guó)AI芯片市場(chǎng)中,GPU占90%以上份額,ASIC、FPGA、NPU等占近10%,預(yù)計(jì)2025年占比會(huì)超過20%。
AI的應(yīng)用場(chǎng)景多種多樣,比如元宇宙、自動(dòng)駕駛以及AIGC等,針對(duì)不同的應(yīng)用需求,對(duì)于算力的需求也有所不同。
01
元宇宙中的GPU算力需求
作為一個(gè)虛擬的并行世界,元宇宙需要大量的算力來模擬現(xiàn)實(shí)世界的一切,包括環(huán)境、物體和人物等。AI技術(shù)能夠幫助元宇宙更加真實(shí)、智能地模擬現(xiàn)實(shí),從而為用戶帶來更加沉浸式的體驗(yàn)。在元宇宙中,算力需求主要體現(xiàn)在圖形渲染、物理模擬、虛擬角色行為智能等方面。
元宇宙作為一種全新的虛擬世界,對(duì)算力的需求極高。從環(huán)境建設(shè)到角色交互,再到持續(xù)的世界運(yùn)轉(zhuǎn),都需要強(qiáng)大的計(jì)算能力。有觀點(diǎn)認(rèn)為,元宇宙的最終理想形態(tài),對(duì)算力資源的需求是近乎無限的。中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏就指出,元宇宙邁入虛擬和現(xiàn)實(shí)融合的3D互聯(lián)網(wǎng)時(shí)代,算力需求呈現(xiàn)指數(shù)級(jí)提升。相關(guān)預(yù)測(cè)顯示,按照元宇宙的構(gòu)想,至少需要現(xiàn)在算力的10的6次方倍。
元宇宙相關(guān)應(yīng)用有三大需求:渲染、物理特性計(jì)算與AI。GPU最初為圖形渲染設(shè)計(jì),后發(fā)展為承擔(dān)科學(xué)計(jì)算和AI計(jì)算。GPU是元宇宙不可或缺的核心工具,需有巨大進(jìn)步才能實(shí)現(xiàn)真實(shí)、受歡迎的體驗(yàn)。英特爾首席架構(gòu)師Raja Koduri曾強(qiáng)調(diào),計(jì)算能力需增加1000倍才能滿足元宇宙的需求。在2025年下一個(gè)十年,來自元宇宙的需求將推動(dòng)GPU在圖形+計(jì)算+AI+物理模擬方面的進(jìn)一步發(fā)展。GPU在元宇宙中將面臨更大爆發(fā),市場(chǎng)相較十年前將呈百倍萬倍增長(zhǎng)。
02
自動(dòng)駕駛進(jìn)入2000TOPS內(nèi)卷時(shí)代
自動(dòng)駕駛算是目前比較成熟的商用落地AI應(yīng)用了。自動(dòng)駕駛技術(shù)的發(fā)展離不開高性能的計(jì)算能力,需要處理大量的傳感器數(shù)據(jù),如激光雷達(dá)、攝像頭和雷達(dá)等,實(shí)現(xiàn)實(shí)時(shí)的目標(biāo)檢測(cè)、跟蹤和路徑規(guī)劃。此外,自動(dòng)駕駛還需要進(jìn)行實(shí)時(shí)的高精度地圖匹配、車輛控制和決策。這些應(yīng)用場(chǎng)景對(duì)算力的需求極高,以確保自動(dòng)駕駛系統(tǒng)的安全性和穩(wěn)定性。
自動(dòng)駕駛芯片已成為智能汽車核心,隨著自動(dòng)駕駛級(jí)別逐步提升和應(yīng)用功能的豐富,對(duì)芯片算力的要求也越來越高。目前,市場(chǎng)上主流自動(dòng)駕駛芯片多為SoC,架構(gòu)分為CPU+GPU+ASIC、CPU+FPGA和CPU+ASIC。長(zhǎng)期來看,定制化的低功耗、低成本ASIC將逐漸取代高功耗GPU。由于自動(dòng)駕駛算法廣泛運(yùn)用深度學(xué)習(xí)等AI算法,車端需要能進(jìn)行推理的AI芯片,云端需進(jìn)行大量數(shù)據(jù)訓(xùn)練的服務(wù)器芯片。目前,Mobileye、英偉達(dá)、特斯拉、高通等廠商在車載計(jì)算芯片方面居于市場(chǎng)前列,產(chǎn)品已廣泛應(yīng)用于中高端和新勢(shì)力車型。
曾幾何時(shí),超過100TOPS的算力已經(jīng)算是比較高端的芯片了。而在英偉達(dá)和高通的“PPT”大戰(zhàn)下,整個(gè)自動(dòng)駕駛芯片行業(yè)正在加速內(nèi)卷,算力門檻一再飆升。目前,英偉達(dá)、高通發(fā)布算力超1000TOPS的 SoC,主用于自動(dòng)駕駛。英偉達(dá)推出1000TOPS DRIVE Atlan,后發(fā)展至2000TOPS Thor。高通推出Snapdragon Ride Flex,最高級(jí)版本算力達(dá)2000TOPS。異構(gòu)計(jì)算提高計(jì)算并行度和效率,典型代表為SoC芯片,如英偉達(dá)Thor,其高算力得益于Hopper GPU、Next-Gen GPU Ada Lovelace和Grace CPU。
在這么卷的情況下,也開始有不少?gòu)S商出來給這場(chǎng)算力競(jìng)爭(zhēng)降降溫了。在行業(yè)玩家都紛紛追求高算力的2022年,Mobileye今年推出的旗艦產(chǎn)品EyeQ Ultra卻只有176TOPS。Mobileye的CEO Ammon Shashua表示,“我們非常坦率地認(rèn)為TOPS是一個(gè)非常不充分的計(jì)算能力指標(biāo),集成在EyeQ芯片中的計(jì)算模型非常復(fù)雜,遠(yuǎn)不是單一指標(biāo)能夠量化的”。
另如Tesla的FSD芯片,也還保持在144 TOPS的算力,但自動(dòng)駕駛的體驗(yàn)?zāi)壳笆菢I(yè)內(nèi)公認(rèn)的頭部位置。
國(guó)內(nèi)的自動(dòng)駕駛芯片代表廠商地平線也認(rèn)為,應(yīng)該更強(qiáng)調(diào)芯片的有效利用率而非只關(guān)注算力。地平線認(rèn)為,盡管競(jìng)品的AI芯片算力更高,但其算力的有效利用率上卻打了很大折扣,不同模型算法的有效利用率有很大差異。實(shí)際使用時(shí)就會(huì)有個(gè)很奇怪的現(xiàn)象,雖然芯片的TOPS很高,但實(shí)際模型跑在芯片上的效果并不好,這正是芯片有效利用率低的表現(xiàn)。
【廣告】
03
AIGC引發(fā)的算力需求激增
AIGC(AI generated content)即人工智能生成內(nèi)容,又稱為生成式AI。指利用人工智能技術(shù)來生成內(nèi)容, 其中包括文字、語音、代碼、圖像、視頻、機(jī)器人動(dòng)作等等。目前最火的AIGC應(yīng)用就是ChatGPT等大型語言模型,這類模型的訓(xùn)練和推理需要大量的計(jì)算資源,尤其是在訓(xùn)練階段,對(duì)GPU和其他高性能計(jì)算設(shè)備的需求極大。
ChatGPT火爆,標(biāo)志AIGC商業(yè)化啟動(dòng),基于大型神經(jīng)網(wǎng)絡(luò)推動(dòng)AI深度發(fā)展,算力需求也同步激增。模型訓(xùn)練是核心挑戰(zhàn),算法模型復(fù)雜度指數(shù)級(jí)增長(zhǎng)。以GPT3為例,1750億參數(shù)、1000億詞匯語料庫(kù)訓(xùn)練,需1000塊英偉達(dá)A100 GPU訓(xùn)練1個(gè)月。不到一年,萬億參數(shù)語言模型Switch Transformer問世。人工智能算力每?jī)蓚€(gè)月翻倍,供給水平影響AI創(chuàng)新及產(chǎn)業(yè)應(yīng)用落地。AI模型進(jìn)入萬億級(jí)時(shí)代,深度學(xué)習(xí)進(jìn)入大模型、大數(shù)據(jù)階段,算力需求每2年超過實(shí)際增長(zhǎng)速度375倍。
有報(bào)告稱,OpenAI為ChatGPT提供服務(wù)需要每天694444美元的運(yùn)營(yíng)成本和約3617臺(tái)HGX A100服務(wù)器。
ChatGPT基于Transformer技術(shù),運(yùn)行需要大規(guī)模預(yù)訓(xùn)練和大量算力。這不僅推動(dòng)了AI底層芯片的需求,也拉動(dòng)了高端芯片的需求。隨著ChatGPT在各領(lǐng)域應(yīng)用的普及,如智能音箱、游戲NPC等,以及使用頻率的提高,對(duì)AI服務(wù)器的需求也在劇增。預(yù)計(jì)全球AI服務(wù)器市場(chǎng)將在2025年達(dá)到288億美元。
AI服務(wù)器主要為CPU+GPU形式,支持大規(guī)模神經(jīng)網(wǎng)絡(luò)模型,我國(guó)服務(wù)器廠商處于全球領(lǐng)先地位,市場(chǎng)規(guī)模增長(zhǎng)空間廣闊。近五年,國(guó)內(nèi)算力產(chǎn)業(yè)增速超30%,排名全球第二。已進(jìn)入超過1000TOPS算力時(shí)代,數(shù)據(jù)中心和超算是典型場(chǎng)景?!缎滦蛿?shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃》指明,2023年底總算力規(guī)模將超200 EFLOPS,2025年超300 EFLOPS。超算中心正向Z級(jí)算力發(fā)展,E級(jí)計(jì)算是全球頂尖超算目標(biāo)。以美國(guó)橡樹嶺實(shí)驗(yàn)室Frontier超算中心為例,其雙精度浮點(diǎn)算力達(dá)到1.1 EOPS。
除了CPU+GPU的形式,由于FPGA具有靈活性高、開發(fā)周期短等特點(diǎn),而ASIC則具有體積小、功耗低等優(yōu)點(diǎn),它們同樣被應(yīng)用于AI服務(wù)器。特別是在機(jī)器學(xué)習(xí)、邊緣計(jì)算等領(lǐng)域,ASIC被廣泛關(guān)注。谷歌的TPU v4和百度的昆侖2代AI芯片都在此方向取得了顯著成果。
值得注意的是,隨著云端芯片處理需求的增加,云端壓力不斷增大,推動(dòng)了AI處理向邊緣轉(zhuǎn)移的趨勢(shì)。由此帶來的用戶需求的變化也在推動(dòng)AI芯片分工方式的變化,一方面希望保護(hù)數(shù)據(jù)隱私,一方面需要及時(shí)處理結(jié)果,因此AI處理的重心正在加快向邊緣轉(zhuǎn)移。
04
總結(jié):后摩爾定律時(shí)代下的
AI算力增長(zhǎng)與挑戰(zhàn)
在以往,芯片算力由數(shù)據(jù)互連、單位晶體管算力、晶體管密度和芯片面積決定。所以要提高芯片算力,主要通過提升系統(tǒng)架構(gòu),采用更先進(jìn)的工藝提高晶體管密度,采用分布式運(yùn)算和異構(gòu)計(jì)算,以及采用新的Chiplet封裝等等方式來實(shí)現(xiàn)。
不過,摩爾定律近年來已經(jīng)趨于飽和,無法維持如此高速的增長(zhǎng)。在此背景下,智能計(jì)算的算力需求卻在7年間提升了6倍。以圖像識(shí)別和自然語言處理為例,其性能的提升背后是對(duì)算力的指數(shù)級(jí)增長(zhǎng)需求。這種需求爆炸式增長(zhǎng)的例證就是GPT系列模型,從GPT-1到GPT-4,在短短5年內(nèi)算力增長(zhǎng)了幾千倍。
在后摩爾定律時(shí)代,AI算力的增長(zhǎng)不僅依賴于硬件的改進(jìn),如摩爾定律所描述的,而且還依賴于軟件和算法的優(yōu)化,數(shù)據(jù)傳輸速率也成為算力瓶頸。算法的效率和計(jì)算架構(gòu)的有效利用率在實(shí)現(xiàn)性能提升中的關(guān)鍵作用。
AI處理器的計(jì)算架構(gòu)需要隨著時(shí)代的發(fā)展進(jìn)行變革,以適應(yīng)不斷發(fā)展的需求。未來的AI處理器不僅需要提供強(qiáng)大的計(jì)算能力,還需要考慮功耗、體積和成本等因素。同時(shí),軟件和硬件的協(xié)同優(yōu)化,也將成為提升AI性能的關(guān)鍵。
總的來說,AI的發(fā)展已經(jīng)深入到我們生活的各個(gè)領(lǐng)域,對(duì)算力的需求也在不斷增長(zhǎng)。未來,包括GPU、NPU和ASIC在內(nèi)的AI處理器,我們將會(huì)看到更多的創(chuàng)新,以滿足這種需求的增長(zhǎng),并推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展。
05
活動(dòng)預(yù)告
· 8月 深圳國(guó)際GPU技術(shù)大會(huì) 隨著AI應(yīng)用的深入和下沉,圍繞算力需求和相關(guān)處理器技術(shù)的討論也將持續(xù)進(jìn)行。8月23日,elexcon深圳國(guó)際電子展在深圳會(huì)展中心(福田)將召開2023年深圳國(guó)際GPU技術(shù)大會(huì),以“AIGC、元宇宙”為主題,聚焦GPU領(lǐng)域的多個(gè)熱門領(lǐng)域,匯聚優(yōu)質(zhì)企業(yè)及知名專家學(xué)者,提供全球嵌入式技術(shù)的行業(yè)交流平臺(tái)。 會(huì)議將包括專家論壇和產(chǎn)業(yè)論壇,幾十場(chǎng)技術(shù)報(bào)告。本次大會(huì)錄用的技術(shù)報(bào)告,將采用公開征詢擇優(yōu)遴選方式,由大會(huì)專家委員會(huì)審核選定,2個(gè)分論壇專題如下: GPU技術(shù)論壇 NPU技術(shù)論壇 前沿論壇:探討AIGC、元宇宙等多個(gè)熱門領(lǐng)域的GPU應(yīng)用 大會(huì)專家委員:(以姓氏筆畫為序) 何虎——清華大學(xué)集成電路學(xué)院副教授、博士生導(dǎo)師李彬——燧原科技首席軟件戰(zhàn)略官 景乃鋒——上海交通大學(xué)電子信息與電氣工程學(xué)院副研究員、博士生導(dǎo)師 熊庭剛——中國(guó)船舶集團(tuán)公司第709研究所首席技術(shù)專家 孫毓忠——中科院計(jì)算所研究員 趙地——凌久微電子有限公司 大會(huì)時(shí)間:2023年8月23日 大會(huì)地點(diǎn):深圳會(huì)展中心(福田)
· 8月同期 嵌入式與AIoT展 2023年深圳國(guó)際GPU技術(shù)大會(huì)現(xiàn)場(chǎng),還將舉辦elexcon 2023深圳國(guó)際電子展暨嵌入式與AIoT展,以“算力持續(xù)增長(zhǎng),洞悉邊緣計(jì)算如何為社會(huì)智能化生態(tài)賦能!”為展示主題,屆時(shí)將匯聚眾多嵌入式領(lǐng)域優(yōu)質(zhì)企業(yè)及專業(yè)觀眾參與。同期還將舉行GPU、物聯(lián)網(wǎng)、嵌入式、FPGA、AI、云計(jì)算、大數(shù)據(jù)、射頻芯片、AR/VR、TSN與工業(yè)數(shù)智化等主題論壇活動(dòng),提供全球嵌入式技術(shù)的專業(yè)交流平臺(tái)。 展示范圍: AI與算力 ?? AI處理器、MCU/MPU、DSP 模擬芯片、存儲(chǔ)、模塊 RISC-V開源生態(tài) ?? 工業(yè)物聯(lián)與AIoT ?? 工控機(jī)/板卡 無線技術(shù) 操作系統(tǒng)、軟件和工具 展覽時(shí)間:2023年8月23-25日 展覽地點(diǎn):深圳會(huì)展中心(福田) ▼2023年部分參展品牌(排名不分先后) 安路、紫光同創(chuàng)、凌久微、高云、易靈思、智多晶、君正、國(guó)芯;航順、靈動(dòng)微電子、沁恒微電子、中電華大、中科芯、凌煙閣、中微、笙泉、中電港、華芯微特、敏矽微、雅特力、瑞凡微、澎湃微、金譽(yù)、聚洵、晶豐明源、潤(rùn)石、領(lǐng)芯微、速顯微、創(chuàng)芯時(shí)代;Silicon Labs、美格智能、廣芯微、順絡(luò)電子、兆訊、芯進(jìn)、微泰、嘉碩、唯創(chuàng)知音、暢想視界、優(yōu)友互聯(lián);江波龍、康芯威、徽憶、沛頓、新芯、康盈、東芯、宇瞻、朗科、金勝、閃芯微、恒爍;研智、飛凌、芯力特、隼瞻、碼靈、英德斯、恩泰世、天嵌、微嵌、邁進(jìn)、金百達(dá)、比派科技;揚(yáng)興、創(chuàng)意電子、新天源、奇普樂 ▼2023【熱門展示專區(qū)】火熱招商中?? GPU技術(shù)專區(qū) AI與算力專區(qū) RISC-V技術(shù)與生態(tài)專區(qū) 車規(guī)級(jí)芯片與元件專區(qū) elexcon深圳國(guó)際電子展由創(chuàng)意時(shí)代與博聞創(chuàng)意創(chuàng)立于2004年,已成為備受海內(nèi)外電子行業(yè)關(guān)注的年度專業(yè)電子展之一,是展示技術(shù)實(shí)力、拓展行業(yè)合作的重要平臺(tái)。更多展會(huì)詳情請(qǐng)登錄m.mf0o.cn 展位、贊助商及演講人申請(qǐng)請(qǐng)聯(lián)系:0755-88311535