走進(jìn)博大數(shù)據(jù)位于深圳前海的智算中心,一座造型方方正正、藍(lán)白相間的建筑格外引人注目。就在這座智算中心的機(jī)房里,一排排智算機(jī)柜整齊排列,服務(wù)器高速運(yùn)轉(zhuǎn),進(jìn)行著復(fù)雜的數(shù)據(jù)分析與計(jì)算任務(wù)。
宋春雨/攝
“作為融合算力服務(wù)商,我們?cè)谧杂械乃懔荷喜渴鹆薉eepSeek-R1671B全量版本供客戶使用,通過(guò)直接提供AI模型給用戶,創(chuàng)造市場(chǎng)上的算力需求,從而拉動(dòng)我們智算中心高密機(jī)柜和算力服務(wù)的銷售?!辈┐髷?shù)據(jù)副總裁白旭告訴證券時(shí)報(bào)記者。
隨著國(guó)產(chǎn)大模型DeepSeek火爆出圈,最近一段時(shí)間以來(lái),來(lái)自各行各業(yè)的許多公司宣布部署DeepSeek大模型,應(yīng)用端的算力需求迎來(lái)大爆發(fā)。業(yè)內(nèi)人士分析稱,DeepSeek通過(guò)降低AI應(yīng)用門檻,推動(dòng)算力需求從“訓(xùn)練主導(dǎo)”轉(zhuǎn)到“推理主導(dǎo)”。面對(duì)嶄新的行業(yè)變局,智算中心需加快轉(zhuǎn)型,從簡(jiǎn)單的算力提供商轉(zhuǎn)向?qū)I(yè)服務(wù)商,提供覆蓋算力全生命周期的專業(yè)服務(wù),提高算力資源利用效率。
DeepSeek部署熱潮帶動(dòng)算力需求提升
最近一段時(shí)間以來(lái),企業(yè)部署DeepSeek的熱情仍然十分高漲。證券時(shí)報(bào)記者注意到,多家上市公司密集宣布已完成DeepSeek大模型的相關(guān)部署工作。
例如,??垂煞?月18日在互動(dòng)平臺(tái)表示,公司已在自研的AI智能審核平臺(tái)等垂類模型中部署接入DeepSeek模型,對(duì)自有平臺(tái)進(jìn)行微調(diào)和優(yōu)化。同日,卓創(chuàng)資訊也發(fā)布消息稱,已完成DeepSeek系列大模型的本地化部署,且正基于DeepSeek-R1模型,運(yùn)用蒸餾技術(shù),著力打造大宗商品行業(yè)大模型。
“DeepSeek很重要的一個(gè)意義,是對(duì)普通大眾進(jìn)行了AI的科普及推廣。各行各業(yè)的人都知曉這款大模型,也紛紛去嘗試使用。這種集中的訪問(wèn)與使用,帶動(dòng)了算力需求的爆發(fā)。”中昊芯英解決方案架構(gòu)師顧立程在接受證券時(shí)報(bào)記者采訪時(shí)表示,今年春節(jié)以來(lái),很多客戶都在詢問(wèn)公司智算中心與DeepSeek的適配情況?!澳壳埃覀兊闹撬阒行囊呀?jīng)能運(yùn)行DeepSeek模型的各種蒸餾版本,并且表現(xiàn)都是非常不錯(cuò)的?!鳖櫫⒊陶f(shuō)。
宋春雨/攝
DeepSeek作為一款開(kāi)源大模型,憑借高性能與低成本的優(yōu)勢(shì),極大地降低了AI應(yīng)用的門檻,正成為下游許多AI應(yīng)用公司及終端廠商部署AI模型的優(yōu)先選項(xiàng)。以不久前正式接入DeepSeek-R1大模型的智慧芽為例,該公司是一家科技創(chuàng)新信息服務(wù)商,公司技術(shù)負(fù)責(zé)人告訴證券時(shí)報(bào)記者,DeepSeek等開(kāi)發(fā)的開(kāi)源模型,確實(shí)可以幫助企業(yè)降低前期開(kāi)發(fā)投入,尤其是可以節(jié)省高昂的基礎(chǔ)設(shè)施試錯(cuò)成本。
記者采訪了解到,企業(yè)的需求不僅是本地化部署DeepSeek大模型,還有許多公司會(huì)基于DeepSeek大模型,依托自有行業(yè)數(shù)據(jù)進(jìn)行定制化開(kāi)發(fā),訓(xùn)練垂類模型或構(gòu)建專業(yè)應(yīng)用。
“印象深刻的是一家律師事務(wù)所,客戶希望我們能協(xié)助他們利用自有的行業(yè)數(shù)據(jù)對(duì)DeepSeek進(jìn)行定制化開(kāi)發(fā),構(gòu)建自有的專業(yè)領(lǐng)域智能應(yīng)用,我們目前正在協(xié)同合作伙伴努力滿足客戶的需求?!卑仔癖硎?,DeepSeek有助于加速國(guó)內(nèi)企業(yè)數(shù)字化轉(zhuǎn)型,政府、金融、制造等行業(yè)客戶因AI應(yīng)用場(chǎng)景(如智能審批、數(shù)字孿生)的擴(kuò)展,對(duì)高密機(jī)柜和邊緣算力設(shè)備的需求會(huì)大大增加。
從“訓(xùn)練主導(dǎo)”到“推理主導(dǎo)”,國(guó)產(chǎn)算力芯片廠商迎利好
訓(xùn)練成本低廉,這是DeepSeek區(qū)別于其他大模型的一大核心優(yōu)勢(shì)。雖然DeepSeek并未公開(kāi)R1模型確切的訓(xùn)練成本,但根據(jù)此前V3模型發(fā)布時(shí)發(fā)表的論文,V3訓(xùn)練成本僅為557.6萬(wàn)美元,約為Meta開(kāi)源大模型訓(xùn)練成本的十分之一。
據(jù)記者采訪了解,大模型主要分為訓(xùn)練和推理兩個(gè)階段,訓(xùn)練是指用大量數(shù)據(jù)訓(xùn)練大模型,通常需要極高的計(jì)算能力和存儲(chǔ)資源;推理是指將訓(xùn)練好的模型應(yīng)用于實(shí)際任務(wù),如提問(wèn)并生成文本、識(shí)別圖片與視頻等。
“傳統(tǒng)大模型訓(xùn)練如同吞噬算力的黑洞,單次訓(xùn)練成本動(dòng)輒數(shù)千萬(wàn)美元的巨額投入,筑起了只有科技巨頭才能逾越的技術(shù)壁壘。算力軍備競(jìng)賽加劇了全球GPU資源的爭(zhēng)奪戰(zhàn),形成了基礎(chǔ)模型研發(fā)的高度中心化格局?!鄙虾=?jīng)邑產(chǎn)業(yè)數(shù)智研究院副院長(zhǎng)沈佳慶向證券時(shí)報(bào)記者表示,DeepSeek打破了這種既定的秩序,將推動(dòng)算力需求的重新分層,過(guò)去高度集中的訓(xùn)練算力需求會(huì)開(kāi)始向應(yīng)用端的推理算力需求擴(kuò)散。
“早在去年年初,我們就預(yù)判智算中心的算力需求結(jié)構(gòu)將從‘訓(xùn)練主導(dǎo)’轉(zhuǎn)向‘推理主導(dǎo)’。大模型訓(xùn)練出來(lái)后要做到有用、能用、好用,DeepSeek成功地做到了這一點(diǎn)從而爆火。”白旭表示,目前國(guó)產(chǎn)算力芯片廠商與國(guó)內(nèi)OEM(原始設(shè)備制造)廠商合作推出DeepSeek一體機(jī),國(guó)內(nèi)各大云平臺(tái)也紛紛上線DeepSeek模型服務(wù),這都大大降低了大模型應(yīng)用的使用門檻。
除了帶動(dòng)推理芯片需求增長(zhǎng)外,DeepSeek對(duì)國(guó)產(chǎn)算力芯片廠商的利好,還來(lái)自于技術(shù)層面。顧立程告訴記者,在DeepSeek推出以前,國(guó)內(nèi)大模型處于一個(gè)“百花齊放”的狀態(tài)。“中昊芯英作為一家AI芯片設(shè)計(jì)及國(guó)產(chǎn)算力硬件平臺(tái)解決方案商,涉及大量的大模型適配需求。而隨著國(guó)內(nèi)大模型的逐漸聚焦,會(huì)加速我們?cè)谒懔τ布脚_(tái)及軟件大模型全國(guó)產(chǎn)解決方案上的定型與市場(chǎng)化?!鳖櫫⒊陶f(shuō)。
事實(shí)上,自1月末以來(lái),從云基礎(chǔ)設(shè)施服務(wù)商到國(guó)產(chǎn)算力芯片廠商,都在緊鑼密鼓地適配DeepSeek大模型。云基礎(chǔ)設(shè)施服務(wù)商方面,華為云、騰訊云、阿里云、百度云等主流的云廠商均已宣布DeepSeek相關(guān)模型上架,可供開(kāi)發(fā)者部署調(diào)用,中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通三大基礎(chǔ)電信企業(yè)也全面接入DeepSeek。國(guó)產(chǎn)芯片公司也“聞風(fēng)而動(dòng)”,據(jù)證券時(shí)報(bào)記者不完全統(tǒng)計(jì),包括天數(shù)智芯、摩爾線程、海光信息、云天勵(lì)飛、壁仞科技、燧原科技、沐曦、昆侖芯等在內(nèi)的十余家國(guó)產(chǎn)芯片公司都已相繼宣布適配DeepSeek模型服務(wù)。
從提供算力到專業(yè)服務(wù),智算中心迎轉(zhuǎn)型機(jī)遇
DeepSeek的崛起,引發(fā)了人們對(duì)于未來(lái)算力需求的廣泛關(guān)注。最近一段時(shí)間以來(lái),二級(jí)市場(chǎng)中的算力板塊和相關(guān)個(gè)股也迎來(lái)了較大的波動(dòng)。
沈佳慶認(rèn)為,短期內(nèi),由于DeepSeek降低了訓(xùn)練成本,會(huì)使得訓(xùn)練環(huán)節(jié)對(duì)大規(guī)模算力的需求出現(xiàn)下降,從而將資源投入到具體解決方案的研發(fā)。“但中長(zhǎng)期來(lái)看,DeepSeek一是會(huì)提升推理、微調(diào)的算力需求,使一部分原來(lái)用于訓(xùn)練環(huán)節(jié)的閑置算力獲得應(yīng)用;二是會(huì)刺激基礎(chǔ)大模型加速迭代,對(duì)算力的需求或?qū)⒊霈F(xiàn)增長(zhǎng)。”沈佳慶表示。
業(yè)內(nèi)人士普遍認(rèn)為,DeepSeek對(duì)智算中心將構(gòu)成長(zhǎng)期利好。但在DeepSeek帶來(lái)“潑天富貴”之前,業(yè)內(nèi)對(duì)于各地踴躍建設(shè)、遍地開(kāi)花的智算中心卻存有疑慮。據(jù)記者采訪了解,近年來(lái),由于人工智能產(chǎn)業(yè)的蓬勃發(fā)展,全國(guó)掀起了規(guī)劃建設(shè)智算中心的熱潮,大大小小的智算中心如雨后春筍般在全國(guó)遍地開(kāi)花。最近,國(guó)際數(shù)據(jù)公司(IDC)與浪潮信息聯(lián)合發(fā)布的《中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》顯示,2024年中國(guó)智能算力規(guī)模同比增長(zhǎng)了74.1%,顯示了我國(guó)在智算領(lǐng)域的大力投入。
然而,一些智算中心存在著利用程度不高、供需錯(cuò)配的問(wèn)題。沈佳慶分析稱,從供應(yīng)側(cè)來(lái)看,為響應(yīng)國(guó)家與地方產(chǎn)業(yè)規(guī)劃的政策導(dǎo)向,加之政府鼓勵(lì),電信、IT軟硬件等領(lǐng)域國(guó)央企和大型民企,秉承“適度超前”的原則,開(kāi)展大規(guī)模的智算中心建設(shè),導(dǎo)致市場(chǎng)供給出現(xiàn)井噴;從需求側(cè)來(lái)看,市場(chǎng)需求雖有增長(zhǎng),但沒(méi)有出現(xiàn)明顯井噴?!耙皇菄?guó)產(chǎn)軟硬件在效能、適用領(lǐng)域等方面還有差距,應(yīng)用效果不及預(yù)期;二是在產(chǎn)業(yè)發(fā)展初期,技術(shù)還未成熟,企業(yè)從理性角度出發(fā),購(gòu)買產(chǎn)品或服務(wù)時(shí)要考慮多重因素,相對(duì)而言會(huì)比較謹(jǐn)慎?!鄙蚣褢c說(shuō)。
算力閑置,曾困擾國(guó)內(nèi)不少智算中心,而DeepSeek或有助于緩解這一難題?!熬拖癞?dāng)年移動(dòng)互聯(lián)網(wǎng)普及一樣,當(dāng)大模型真正成為大家習(xí)慣使用的工具,到時(shí)就將迸發(fā)出非常龐大的算力需求?!鳖櫫⒊瘫硎荆崆安季种撬阒行?,才能保證需求真正爆發(fā)時(shí),智算中心能夠承載得住這“潑天的流量”。
對(duì)于智算中心而言,DeepSeek還帶來(lái)了新的發(fā)展方向和機(jī)遇。據(jù)白旭介紹,智算中心的產(chǎn)品模式已不再局限于高密機(jī)柜和算力服務(wù)的提供,而是可以直接部署模型應(yīng)用給企業(yè)使用。
“智算中心應(yīng)從簡(jiǎn)單的以硬件建設(shè)為主,轉(zhuǎn)向以提供專業(yè)服務(wù)為主的新發(fā)展階段?!鄙蚣褢c認(rèn)為,算力從一種基礎(chǔ)資源,到真正變成普遍應(yīng)用的生產(chǎn)力工具,中間還有梗阻,這些也是智算中心能夠發(fā)力的市場(chǎng)機(jī)遇?!巴ㄟ^(guò)提供覆蓋算力全生命周期的專業(yè)服務(wù),與產(chǎn)業(yè)鏈上不同的主體合作,提供包括算力調(diào)度、計(jì)量、優(yōu)化、微調(diào)、封裝、維護(hù)、二次開(kāi)發(fā)等在內(nèi)的一攬子解決方案,將有效推動(dòng)算力服務(wù)在各行各業(yè)的滲透應(yīng)用,從而擴(kuò)大整個(gè)智算中心的市場(chǎng)需求?!鄙蚣褢c說(shuō)。
校對(duì):王朝全???