2025年的CES刮起AI旋風(fēng)。
AI Agent的興起、AI硬件的火熱,都反映了AI應(yīng)用正在加速爆發(fā)。隨著應(yīng)用走進(jìn)千行百業(yè),大模型和算力市場(chǎng)雙雙掀開(kāi)新篇章。
一方面,AI大模型更強(qiáng)化商用探索,從訓(xùn)練轉(zhuǎn)向了推理,如果將訓(xùn)練看作是AI模型的研發(fā)建設(shè)階段,那么推理便是模型商業(yè)化落地的核心階段。不論是OpenAI o1、Gemini 2.0 Flash Thinking,還是DeepSeek R1-Lite-Preview,都在提升推理能力,進(jìn)一步支撐應(yīng)用開(kāi)發(fā)。
另一方面,隨著AI推理來(lái)到了聚光燈下,成為行業(yè)焦點(diǎn),AI算力的市場(chǎng)上,對(duì)推理基礎(chǔ)設(shè)施的需求正在上升。
巴克萊研報(bào)指出,目前,AI推理計(jì)算需求將快速提升,預(yù)計(jì)其將占通用人工智能總計(jì)算需求的70%以上,推理計(jì)算的需求甚至可以超過(guò)訓(xùn)練計(jì)算需求,達(dá)到后者的4.5倍。
在AI推理的新時(shí)代,芯片廠商們正在開(kāi)啟新策略。從CES上的動(dòng)作來(lái)看,英偉達(dá)可謂激進(jìn),直接在端側(cè)推出超級(jí)計(jì)算機(jī)Project DIGITS,以“PC主機(jī)”的形態(tài)讓個(gè)人用戶可以運(yùn)行模型推理,開(kāi)發(fā)AI應(yīng)用。
可以說(shuō),Project DIGITS直接在終端計(jì)算上開(kāi)辟了新戰(zhàn)線。而云端的戰(zhàn)場(chǎng)上,推理芯片的競(jìng)賽正在拉開(kāi)大幕,英偉達(dá)、AMD酣戰(zhàn)外,云廠商、初創(chuàng)企業(yè)都在尋找推理的生存路徑。
端側(cè)AI崛起:英偉達(dá)的2C“芯”
首先從端側(cè)看,Project DIGITS搭載全新GB10超級(jí)芯片,成為全球最小的可運(yùn)行200B參數(shù)模型的AI超級(jí)計(jì)算機(jī)。
在生成式AI應(yīng)用的爆發(fā)前夜,英偉達(dá)要將它的算力網(wǎng)進(jìn)一步鋪開(kāi),如今它已經(jīng)將生成式AI鋪到了開(kāi)發(fā)者的桌面上。
英偉達(dá)似乎在展示生成式AI時(shí)代,AI PC的未來(lái)模樣。盡管DIGITS作為初代產(chǎn)品,主要面向的還是研發(fā)人員、科學(xué)家、開(kāi)發(fā)者,但是它向我們展示了更強(qiáng)大的個(gè)人算力使用場(chǎng)景,為端側(cè)AI的發(fā)展提供了新的可能。
這種設(shè)計(jì),不僅為開(kāi)發(fā)者提供了更加便捷、高效的工具,也進(jìn)一步降低了AI算力應(yīng)用的門檻。英偉達(dá)試圖通過(guò)這一戰(zhàn)略,將生成式AI從云端拉向終端,從高成本的少數(shù)派應(yīng)用,轉(zhuǎn)向更具普及性的AI。
當(dāng)然,英偉達(dá)并非唯一玩家,在CES上,AMD、高通、英特爾等廠商同樣在端側(cè)AI領(lǐng)域積極布局。
以AMD為例,其推出的銳龍AI Max系列移動(dòng)處理器,憑借集成的新一代神經(jīng)處理單元(NPU),在Windows筆記本市場(chǎng)表現(xiàn)不俗。而基于“Zen 5”架構(gòu)的銳龍AI 300系列,則進(jìn)一步增強(qiáng)了多任務(wù)處理能力和續(xù)航時(shí)間,從輕薄筆記本到日常辦公電腦,AMD正試圖在不同市場(chǎng)細(xì)分領(lǐng)域拓展份額。
與此同時(shí),英特爾也推出了一系列CPU,包括酷睿Ultra 200V系列、Ultra 200H系列、Ultra 200HX系列、Ultra 200U系列、Ultra 200S系列。這些細(xì)分的CPU,涵蓋從高性能到入門級(jí)的不同應(yīng)用場(chǎng)景。而高通則通過(guò)Snapdragon X入門級(jí)處理器,嘗試將AI技術(shù)下沉至價(jià)格更加親民的筆記本市場(chǎng),使OEM能夠在600美元左右的范圍內(nèi)銷售Copilot+電腦。
對(duì)比來(lái)看,同樣是針對(duì)AI PC,不論是AMD、英特爾還是高通,更多的是繼續(xù)在芯片層面更新,但是英偉達(dá)已經(jīng)另辟蹊徑,探索軟硬件一體化的新AI PC賽道。
或者說(shuō),“賣鏟子”的英偉達(dá)始終有一顆2C的“芯”??v觀英偉達(dá)的歷史,很早就希望做一家to C的公司,比如說(shuō)之前做游戲主機(jī)。但現(xiàn)實(shí)卻是相反,英偉達(dá)走上了算力提供方的角色道路,越來(lái)越像一家純粹to B的公司。
兜兜轉(zhuǎn)轉(zhuǎn),在AI PC領(lǐng)域,英偉達(dá)再次回到C端市場(chǎng),對(duì)產(chǎn)業(yè)鏈進(jìn)行了整合。從Arm架構(gòu)到GPU、CPU的整合,對(duì)于英偉達(dá)而言,是自身產(chǎn)品能力的外溢,現(xiàn)有的技術(shù)框架支撐英偉達(dá)開(kāi)啟新產(chǎn)品線。
從另一個(gè)角度來(lái)說(shuō),現(xiàn)在很多人買一臺(tái)電腦,主要就是買一張顯卡,英偉達(dá)也是在橫向擴(kuò)展自己的產(chǎn)品線。面向未來(lái)的AI PC市場(chǎng),我們可能不會(huì)為了惠普、戴爾這些品牌而產(chǎn)生高溢價(jià)的購(gòu)買行為,相反,英偉達(dá)憑借在PC用戶中的號(hào)召力,已經(jīng)和這些巨頭有絕對(duì)的一戰(zhàn)之力。
對(duì)比來(lái)看,英特爾或者別的算力公司也始終在嘗試更多的業(yè)態(tài)和技術(shù)路線,但是在業(yè)內(nèi)人士看來(lái),要打敗英偉達(dá)一定不是通過(guò)英偉達(dá),而是要有下一個(gè)時(shí)代的技術(shù)方向和路徑,不能再用上一代的車去開(kāi)下一代的路。
從目前來(lái)看,英偉達(dá)的戰(zhàn)略路線非常清晰,不斷的通過(guò)軟件加硬件以及現(xiàn)在的to C成品產(chǎn)品來(lái)形成自己的端側(cè)壁壘。英特爾、AMD等對(duì)手能否超車,也取決于他們是否能在下一代計(jì)算方向上占據(jù)先機(jī)。
不論競(jìng)爭(zhēng)態(tài)勢(shì)如何,端側(cè)AI的崛起,都標(biāo)志著算力進(jìn)入了新的階段。從數(shù)據(jù)中心到個(gè)人桌面,從企業(yè)用戶到普通消費(fèi)者,AI的未來(lái)正在變得更加觸手可及。
AI推理時(shí)代:創(chuàng)新在“邊緣”
DIGITS是英偉達(dá)開(kāi)啟的終端側(cè)創(chuàng)新產(chǎn)品線,而當(dāng)前AI的增長(zhǎng)仍主要在云端。尤其是,隨著推理需求越來(lái)越旺盛,推理計(jì)算的競(jìng)爭(zhēng)也更加激烈。AI訓(xùn)練市場(chǎng)上英偉達(dá)占據(jù)九成市場(chǎng),但是AI推理市場(chǎng)在打開(kāi)更多空間。
在2024年10月,英偉達(dá)管理層在AI路演上就特別提到了推理帶來(lái)的市場(chǎng)。高管表示,當(dāng)前仍是AI周期的早期階段,隨著OpenAI o1模型的發(fā)布,新的AI敘事正在展開(kāi),開(kāi)始轉(zhuǎn)向解決更復(fù)雜的推理問(wèn)題,這將提升對(duì)硬件組合的需求,而英偉達(dá)即將推出的機(jī)架產(chǎn)品是最佳解決方案。
從英偉達(dá)的視角看,當(dāng)前英偉達(dá)最新架構(gòu)的Blackwell架構(gòu)芯片已經(jīng)全面投產(chǎn),隨著AI應(yīng)用走向千行百業(yè),英偉達(dá)提供更多的配置來(lái)滿足算力需求。
比如,在CES上,英偉達(dá)就展示了GNVL72大芯片,樣品由72個(gè)Blackwell GPU構(gòu)成,主要是針對(duì)更大的算力需求、更低的能耗要求進(jìn)行了升級(jí)。而GB200引入了先進(jìn)的功能和第二代Transformer引擎,可加速LLM推理工作負(fù)載,據(jù)悉新一代的GB300將對(duì)推理模型會(huì)有更好的支持。
與此同時(shí),推理市場(chǎng)上的競(jìng)爭(zhēng)者著實(shí)不少。比如科技大廠AWS、谷歌、微軟,各家的ASIC芯片、TPU芯片也在不斷迭代之中;又比如Groq、SambaNova、Positron AI等初創(chuàng)企業(yè),大家都想從推理中分一杯羹。
英偉達(dá)在訓(xùn)練市場(chǎng)的絕對(duì)壟斷地位,使得其他玩家很難直接切入這一領(lǐng)域,因此推理市場(chǎng)成為諸多初創(chuàng)公司和競(jìng)爭(zhēng)者的關(guān)注焦點(diǎn)。此前,推理市場(chǎng)像是算力界的“邊緣”市場(chǎng),而現(xiàn)在,推理市場(chǎng)逐步成為了行業(yè)焦點(diǎn),更多的創(chuàng)新在這里涌現(xiàn)。
在這一市場(chǎng)中,差異化競(jìng)爭(zhēng)正在形成。例如,一些企業(yè)專注于開(kāi)發(fā)針對(duì)推理場(chǎng)景優(yōu)化的專用芯片,以在特定工作負(fù)載下提升性能;另一些公司則嘗試通過(guò)軟硬件協(xié)同優(yōu)化,為計(jì)算場(chǎng)景提供更經(jīng)濟(jì)高效的解決方案。
而這也是一場(chǎng)殘酷的算力角逐游戲,在算力市場(chǎng)上面開(kāi)發(fā)出新物種并非易事,因?yàn)樾挛锓N是在GPU的絕對(duì)統(tǒng)治力之下,在細(xì)分領(lǐng)域生存進(jìn)化的結(jié)果。
面對(duì)推理算力需求的增長(zhǎng),硬件市場(chǎng)更加細(xì)分了,競(jìng)爭(zhēng)也更加激烈。雖然從各種預(yù)測(cè)看,推理市場(chǎng)未來(lái)的增勢(shì)很大,但是眼下英偉達(dá)已經(jīng)吃掉市面上的大部分算力的利潤(rùn),推理部分的細(xì)分蛋糕,如何切割,依然是比較殘酷的競(jìng)爭(zhēng)。
而有意思的是,當(dāng)年英偉達(dá)所處的位置也是邊緣市場(chǎng)。原來(lái)的GPU的生存之道是圖形計(jì)算,但是計(jì)算機(jī)的圖形計(jì)算的重要性并不是很高,它是諸多計(jì)算任務(wù)當(dāng)中的一個(gè)分支,但是它慢慢變得更重要,從邊緣進(jìn)入關(guān)鍵的核心。
現(xiàn)在,推理也在從邊緣進(jìn)入到中心舞臺(tái),毫無(wú)疑問(wèn),接下來(lái)AI場(chǎng)上將迎來(lái)更繁榮的推理芯片和應(yīng)用生態(tài)。在未來(lái)的硬件架構(gòu)中,可能有更多組合,有專門用來(lái)做通用計(jì)算的CPU、有專門做訓(xùn)練的GPU,也有專門做推理的推理芯片。
在異構(gòu)計(jì)算中,英偉達(dá)必然是強(qiáng)大的算力基礎(chǔ),但對(duì)于企業(yè)而言要更換一套體系也是成本。而英偉達(dá)的競(jìng)爭(zhēng)者們?nèi)绾瓮ㄟ^(guò)軟硬件結(jié)合等創(chuàng)新,形成細(xì)分場(chǎng)景的突圍路徑,也值得關(guān)注。