AV天堂无码手机版,国产人国产视频。,一本到综在合线亚洲,av免费无码天堂在线

英偉達,突發(fā)!事關DeepSeek
來源:證券時報網作者:券商中國 時謙2025-01-31 13:12

英偉達也認可了!

據英偉達官網最新消息,為了幫助開發(fā)人員安全地試驗這些功能并構建自己的專用代理,6710億參數的DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發(fā)人員可以使用應用程序編程接口(API)進行測試和試驗,該接口預計很快將作為可下載的NIM微服務提供,是NVIDIA AI Enterprise軟件平臺的一部分。

此外,英偉達還在官網中表示,DeepSeek-R1是一個具有最先進推理能力的開放模型。DeepSeek-R1等推理模型不會提供直接響應,而是對查詢進行多次推理,采用思路鏈、共識和搜索方法來生成最佳答案。

來自英偉達的認可

英偉達稱,DeepSeek-R1等推理模型不會提供直接響應,而是對查詢進行多次推理,采用思路鏈、共識和搜索方法來生成最佳答案。執(zhí)行這一系列推理過程(使用推理得出最佳答案)稱為測試時間擴展。DeepSeek-R1是此擴展定律的完美示例,證明了加速計算對于代理AI推理的需求至關重要。

由于模型可以反復“思考”問題,因此它們會創(chuàng)建更多輸出標記和更長的生成周期,因此模型質量會不斷提高。大量的測試時計算對于實現實時推理和來自DeepSeek-R1等推理模型的更高質量響應至關重要,這需要更大規(guī)模的推理部署。R1在需要邏輯推理、推理、數學、編碼和語言理解的任務中提供了領先的準確性,同時還提供了高推理效率。

為了幫助開發(fā)人員安全地試驗這些功能并構建自己的專用代理,6710億參數的DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發(fā)人員可以使用應用程序編程接口(API)進行測試和試驗,該接口預計很快將作為可下載的NIM微服務提供,是NVIDIA AI Enterprise軟件平臺的一部分。

DeepSeek-R1 NIM微服務通過支持行業(yè)標準API簡化了部署。企業(yè)可以通過在其首選的加速計算基礎設施上運行NIM微服務來最大限度地提高安全性和數據隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還可以為專門的AI代理創(chuàng)建定制的DeepSeek-R1 NIM微服務。

DeepSeek-R1是一個大型混合專家(MoE)模型。它包含了令人印象深刻的6710億個參數——比許多其他流行的開源LLM多10倍——支持128000個Token的大輸入上下文長度。該模型還在每個層中使用了極多的專家。R1的每一層都有256位專家,每個Token并行路由到八個不同的專家進行評估。

為R1提供實時答案需要許多具有高計算性能的GPU,并通過高帶寬和低延遲通信進行連接,以將提示令牌路由到所有專家進行推理。結合NVIDIA NIM微服務中提供的軟件優(yōu)化,一臺使用NVLink和NVLink Switch連接的帶有八個H200 GPU的服務器可以以每秒高達3872個令牌的速度運行完整的6710億參數DeepSeek-R1模型。這種吞吐量是通過在每一層使用 NVIDIA Hopper 架構的FP8 Transformer Engine實現的,并且使用900GB/s的NVLink帶寬進行MoE專家通信。

充分利用GPU的每秒浮點運算(FLOPS)性能對于實時推理至關重要。下一代NVIDIA Blackwell架構將通過第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的測試時間擴展,第五代Tensor Core可提供高達20 petaflops的峰值FP4計算性能,以及專門針對推理優(yōu)化的72-GPU NVLink域。

從開源到復現

近日,加州大學伯克利分校的研究人員開發(fā)出了中國開發(fā)的 AI 語言模型DeepSeek R1-Zero的小規(guī)模語言模型復制品,成本約為30美元。語言模型TinyZero是由校園研究生Jiayi Pan和其他三名研究人員領導的項目,由校園教授Alane Suhr教授和伊利諾伊大學厄巴納-香檳分校助理教授Hao Peng指導。

DeepSeek的R1模型權重和代碼庫采用公共MIT許可證,因此Pan和他的團隊能夠訪問基礎代碼來訓練一個明顯小得多的模型。潘表示,TinyZero同樣是開源的,這意味著代碼可供公眾使用。他說,TinyZero 的開源性質允許人們下載代碼并嘗試訓練和修改模型?!靶∫?guī)模復制非常容易實現,而且成本非常低,即使人們將其作為實驗的副項目,”潘說?!皬捻椖恳婚_始,我們的目標基本上就是揭開如何訓練這些模型的神秘面紗,更好地理解它們背后的科學和設計決策?!?/p>

昨天,微軟官網顯示,DeepSeek R1現已在Azure AI Foundry和 GitHub上的模型目錄中提供,加入了1800多個模型的多樣化產品組合,包括前沿、開源、行業(yè)特定和基于任務的AI模型。作為Azure AI Foundry的一部分,DeepSeek R1可在值得信賴、可擴展且企業(yè)級就緒的平臺上訪問,使企業(yè)能夠無縫集成高級AI,同時滿足SLA、安全性和負責任的AI承諾——所有這些都由Microsoft的可靠性和創(chuàng)新支持。

黑石最新態(tài)度

本周,硅谷、華盛頓、華爾街等地的領導人因中國人工智能公司DeepSeek的意外崛起而陷入混亂。許多分析師認為DeepSeek的成功動搖了推動美國人工智能行業(yè)發(fā)展的核心信念。

但人工智能科學家反駁說,許多擔憂都是夸大其詞。他們表示,盡管DeepSeek確實代表了人工智能效率的真正進步,但美國人工智能行業(yè)仍然具有關鍵優(yōu)勢。蘭德公司人工智能研究員倫納特·海姆表示:“這并不是人工智能前沿能力的飛躍。我認為市場只是搞錯了?!?/p>

另外,截至目前,私募股權巨頭、全球主要人工智能系統數據中心投資者黑石集團仍持樂觀態(tài)度?!拔覀內匀徽J為,實體基礎設施、數據中心和電力的需求十分迫切,”黑石總裁喬納森·格雷(Jonathan Gray)周四在與投資者舉行的第四季度財報電話會議上表示。“這些需求的使用方式可能會發(fā)生變化?!?/p>

格雷表示,與投資界和企業(yè)界的大多數人一樣,黑石集團的高管在過去一周花了大量時間來權衡DeepSeek的影響。近年來,黑石集團積極購買和建設數據中心,這是科技公司運行人工智能系統所使用的物理基礎設施。2021年,黑石集團以100億美元收購了美國數據中心公司QTS,去年,黑石集團牽頭以約160億美元收購了在亞洲運營數據中心的AirTrunk。

格雷同時預計,隨著人工智能計算能力成本的大幅下降,人工智能將得到更廣泛的應用。換句話說,雖然人工智能模型回答特定問題所需的能力可能會減少,但人們會提出更多問題。格雷表示,黑石集團只為簽訂長期租約的科技公司建造數據中心?!拔覀儾粫稒C性地建造它們?!彼赋?,客戶使用這些數據中心的方式很可能會改變。

責編:羅曉霞

校對:楊立林

責任編輯: 吳曉輝
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網友評論
登錄后可以發(fā)言
發(fā)送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    <nav id="iiiii"></nav>
      <noscript id="iiiii"><dd id="iiiii"></dd></noscript><tfoot id="iiiii"><noscript id="iiiii"></noscript></tfoot><nav id="iiiii"><sup id="iiiii"></sup></nav>
      <nav id="iiiii"><sup id="iiiii"></sup></nav>
    • <sup id="iiiii"><code id="iiiii"></code></sup>
      <sup id="iiiii"></sup>
    • <code id="iiiii"><object id="iiiii"></object></code>
    • <sup id="iiiii"></sup>