在线观看精品综合一区,国产免费一区二区三区最新,国语自产精品视频在线看

DeepSeek又有大消息。

3月1日，DeepSeek發(fā)表題為《DeepSeek-V3/R1 推理系統(tǒng)概覽》的文章，全面揭曉V3/R1 推理系統(tǒng)背后的關(guān)鍵秘密。

最為引人注目的是，文章首次披露了DeepSeek的理論成本和利潤(rùn)率等關(guān)鍵信息。據(jù)介紹，假定GPU租賃成本為2美元/小時(shí)，總成本為87072美元/天；如果所有tokens全部按照DeepSeek R1的定價(jià)計(jì)算，理論上一天的總收入為562027美元/天，成本利潤(rùn)率為545%。

根據(jù)DeepSeek官方披露，DeepSeek V3和R1的所有服務(wù)均使用H800 GPU，使用和訓(xùn)練一致的精度，即矩陣計(jì)算和dispatch 傳輸采用和訓(xùn)練一致的FP8格式，core-attention計(jì)算和combine傳輸采用和訓(xùn)練一致的BF16，最大程度保證了服務(wù)效果。

另外，由于白天的服務(wù)負(fù)荷高，晚上的服務(wù)負(fù)荷低，因此DeepSeek實(shí)現(xiàn)了一套機(jī)制，在白天負(fù)荷高的時(shí)候，用所有節(jié)點(diǎn)部署推理服務(wù)。晚上負(fù)荷低的時(shí)候，減少推理節(jié)點(diǎn)，以用來做研究和訓(xùn)練。

在最近24小時(shí)（2025年2月27日12:00至28日12:00）的統(tǒng)計(jì)周期內(nèi)：GPU租賃成本按2美元/小時(shí)計(jì)算，日均成本為87072美元；若所有輸入/輸出token按R1定價(jià)（輸入1元/百萬token、輸出16元/百萬token）計(jì)算，單日收入可達(dá)562027美元，成本利潤(rùn)率高達(dá)545%。

不過，DeepSeek官方坦言，實(shí)際上沒有這么多收入，因?yàn)閂3的定價(jià)更低，同時(shí)收費(fèi)服務(wù)只占了一部分，另外夜間還會(huì)有折扣。

DeepSeek的高利潤(rùn)率源于其創(chuàng)新的推理系統(tǒng)設(shè)計(jì)，核心包括大規(guī)?？绻?jié)點(diǎn)專家并行（EP）、計(jì)算通信重疊與負(fù)載均衡優(yōu)化三大技術(shù)支柱：專家并行（EP）提升吞吐與響應(yīng)速度，針對(duì)模型稀疏性（每層僅激活8/256個(gè)專家），采用EP策略擴(kuò)展總體批處理規(guī)模（batch size），確保每個(gè)專家獲得足夠的計(jì)算負(fù)載，顯著提升GPU利用率；部署單元?jiǎng)討B(tài)調(diào)整（如Prefill階段4節(jié)點(diǎn)、Decode階段18節(jié)點(diǎn)），平衡資源分配與任務(wù)需求。

計(jì)算與通信重疊隱藏延遲，Prefill階段通過“雙batch交錯(cuò)”實(shí)現(xiàn)計(jì)算與通信并行，Decode階段拆分attention為多級(jí)流水線，最大限度掩蓋通信開銷。

全局負(fù)載均衡避免資源浪費(fèi)，針對(duì)不同并行模式（數(shù)據(jù)并行DP、專家并行EP）設(shè)計(jì)動(dòng)態(tài)負(fù)載均衡器，確保各GPU的計(jì)算量、通信量及KVCache占用均衡，避免節(jié)點(diǎn)空轉(zhuǎn)。

簡(jiǎn)單來說，EP就像是“多人協(xié)作”，把模型中的“專家”分散到多張GPU上進(jìn)行計(jì)算，大幅提升Batch Size，榨干GPU算力，同時(shí)專家分散，降低內(nèi)存壓力，更快響應(yīng)。

DeepSeek在工程層面進(jìn)一步壓縮成本。晝夜資源調(diào)配：白天高峰時(shí)段全力支持推理服務(wù)，夜間閑置節(jié)點(diǎn)轉(zhuǎn)用于研發(fā)訓(xùn)練，最大化硬件利用率；緩存命中率達(dá)56.3%：通過KVCache硬盤緩存減少重復(fù)計(jì)算，在輸入token中，有3420億個(gè)（56.3%）直接命中緩存，大幅降低算力消耗。

綜合自券商中國(guó)

責(zé)任編輯：梁秋燕

聲明：證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確，文章提及內(nèi)容僅供參考，不構(gòu)成實(shí)質(zhì)性投資建議，據(jù)此操作風(fēng)險(xiǎn)自擔(dān)

下載“證券時(shí)報(bào)”官方APP，或關(guān)注官方微信公眾號(hào)，即可隨時(shí)了解股市動(dòng)態(tài)，洞察政策信息，把握財(cái)富機(jī)會(huì)。

網(wǎng)友評(píng)論

登錄后可以發(fā)言

發(fā)送

網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法，并不表明證券時(shí)報(bào)立場(chǎng)

暫無評(píng)論

為你推薦

DeepSeek首次披露：理論成本利潤(rùn)率545%！

證券時(shí)報(bào) 周春媚 2025-03-01 16:46
深圳市重磅發(fā)布支持前海金融高質(zhì)量發(fā)展行動(dòng)方案

證券時(shí)報(bào)網(wǎng) 卓泳 2025-03-01 16:55
上調(diào)中國(guó)股市評(píng)級(jí)！為何在此時(shí)？有何變化？大摩分析師詳解

券商中國(guó) 沈?qū)?/span> 2025-03-01 12:53
突發(fā)！談崩了！特朗普，最新表態(tài)！

券商中國(guó) 陳銘 2025-03-01 10:53
辭職？剛剛，澤連斯基回應(yīng)！普京，最新簽署！

券商中國(guó) 周樂 2025-03-01 20:45
廣西“拼了”！將推“1+10+N” 基金集群

創(chuàng)業(yè)資本匯吳家明 2025-03-01 18:39

AV天堂无码手机版,国产人国产视频。,一本到综在合线亚洲,av免费无码天堂在线