DeepSeek又傳來重磅消息。
2月25日,據(jù)路透社報(bào)道,DeepSeek計(jì)劃提前發(fā)布其新一代AI模型R2。該公司最初計(jì)劃在5月推出,但目前正在努力盡快推出。DeepSeek表示,新模型將在編程能力和多語(yǔ)言推理方面有所提升。
對(duì)此,幻方量化相關(guān)人士回復(fù)券商中國(guó)記者,“以官方消息為準(zhǔn)?!?/p>
此外,阿里巴巴將于今日晚間全面開源旗下視頻生成模型萬(wàn)相2.1模型。
值得注意的是,DeepSeek API開放平臺(tái)今日也宣布重新開啟API充值服務(wù)。由于服務(wù)器資源緊張,該平臺(tái)曾在2月6日暫停了API服務(wù)的充值功能。
DeepSeek-R2要來了?
DeepSeek的下一代模型R2的進(jìn)展備受市場(chǎng)關(guān)注。
2月25日,據(jù)路透社報(bào)道,DeepSeek計(jì)劃提前發(fā)布其新一代AI模型R2。據(jù)知情人士透露,R2原定于5月初發(fā)布,但現(xiàn)在公司希望盡快推出。DeepSeek表示,新模型將在編程能力和多語(yǔ)言推理方面有所提升。對(duì)于R2 的發(fā)布時(shí)間表,沒有提供具體細(xì)節(jié)。
印度技術(shù)服務(wù)提供商Zensar的首席運(yùn)營(yíng)官Vijayasimha Alilughatta表示:“DeepSeek的R2模型發(fā)布可能會(huì)成為AI行業(yè)的一個(gè)關(guān)鍵時(shí)刻。DeepSeek成功打造了具有高性價(jià)比的AI模型,將促使全球公司加速研發(fā)進(jìn)程,打破目前由幾家主導(dǎo)企業(yè)壟斷的格局?!?/p>
對(duì)此,幻方量化相關(guān)人士回復(fù)券商中國(guó)記者,“以官方消息為準(zhǔn)。”
此前,有行業(yè)人士在Reddit中發(fā)帖表示,DeepSeek-R1在編碼和SWE-Bench方面已經(jīng)與OpenAI匹敵,甚至沒有使用他們最大的突破——強(qiáng)化學(xué)習(xí) (RL),這種情況即將改變?!八麄冋诮鉀Q這個(gè)問題。未來版本將集成拒絕采樣和異步評(píng)估,使強(qiáng)化學(xué)習(xí)可用于軟件工程。路線圖非常清晰:DeepSeek-R2將是一次優(yōu)化飛躍,而不是算法飛躍。如果說DeepSeek證明了什么,那就是他們解決優(yōu)化問題的能力。”
分析認(rèn)為,DeepSeek的成功得益于幻方投資十多年來在研究和計(jì)算力方面的大量投入?;梅接?020年和2021年斥資12億元人民幣建立了兩個(gè)AI超級(jí)計(jì)算集群,其中包括約1萬(wàn)片英偉達(dá)A100芯片。
據(jù)知情人士透露,DeepSeek前員工表示,公司的成功主要?dú)w功于梁文鋒專注于更具成本效益的AI架構(gòu)。DeepSeek采用了混合專家(MoE)和多頭潛在注意力(MLA)等技術(shù),大大降低了計(jì)算成本。
伯恩斯坦經(jīng)紀(jì)公司的分析師在2月初估計(jì),DeepSeek的定價(jià)比OpenAI同類模型的收費(fèi)便宜20到40倍。這也引發(fā)OpenAI在本月降價(jià),而谷歌的Gemini也推出了折扣訪問層級(jí)。自R1推出以來,OpenAI還發(fā)布了一款依賴較少計(jì)算能力的O3-Mini模型。
此外,DeepSeek API開放平臺(tái)今日也宣布重新開啟API充值服務(wù)。此前,由于服務(wù)器資源緊張,該平臺(tái)曾在2月6日暫停了API服務(wù)的充值功能。
阿里將發(fā)布視頻生成模型
與此同時(shí),阿里巴巴也傳來一則重磅消息。
據(jù)新浪科技從知情人士處獲悉,阿里巴巴將于今日晚間全面開源旗下視頻生成模型萬(wàn)相2.1模型。今年1月,阿里旗下萬(wàn)相剛宣布推出2.1版本模型升級(jí),視頻生成、圖像生成兩大能力均獲得提升。
在視頻生成方面,萬(wàn)相2.1通過自研的高效VAE和DiT架構(gòu)增強(qiáng)了時(shí)空上下文建模能力,支持無限長(zhǎng)1080P視頻的高效編解碼,首次實(shí)現(xiàn)了中文文字視頻生成功能,登上VBench榜單第一。
據(jù)此前介紹,萬(wàn)相2.1支持中英文視頻,可以一鍵生成藝術(shù)字,還提供多種視頻特效選項(xiàng),以增強(qiáng)視覺表現(xiàn)力,例如過渡、粒子效果、模擬等。
隨著萬(wàn)相2.1模型開源,這意味著更多的開發(fā)者,將能夠低成本獲取并使用該模型底層代碼,進(jìn)而用以開展與自身業(yè)務(wù)相關(guān)的各類視頻生成應(yīng)用。
值得注意的是,就在今日早間,阿里Qwen團(tuán)隊(duì)在社交媒體宣布發(fā)布新推理模型——深度思考(QwQ)。這是在QWQ-MAX-PREVIEW支持下,一個(gè)基于Qwen2.5-Max的推理模型。QwQ可同時(shí)支持深度思考和聯(lián)網(wǎng)搜索,并會(huì)展示完整的思維鏈。
Qwen團(tuán)隊(duì)稱,QWQ-MAX官方版本即將發(fā)布,同步會(huì)發(fā)布Android和iOS應(yīng)用程序,還會(huì)發(fā)布更小的可在本地設(shè)備部署的模型,如QWQ-32B等。
AI芯片需求激增?宇宙最重要的財(cái)報(bào)即將來襲
值得注意的是,DeepSeek的崛起一度讓投資者質(zhì)疑,英偉達(dá)的尖端芯片是否還是科技公司在人工智能競(jìng)賽中的“制勝法寶”?英偉達(dá)市值1月底曾一天蒸發(fā)5930億美元,創(chuàng)下美國(guó)公司單日市值損失之最。
不過,事實(shí)可能并非如此,DeepSeek的橫空出世,引發(fā)各行各業(yè)的多家企業(yè)紛紛布局采用DeepSeek,或使得英偉達(dá)AI芯片需求大增。
據(jù)路透社消息,中國(guó)企業(yè)推出低成本人工智能模型DeepSeek后,顯著推高了模型使用的英偉達(dá)人工智能芯片在中國(guó)市場(chǎng)的需求。路透社引述知情人士的消息說,多家互聯(lián)網(wǎng)巨頭對(duì)同款H20芯片的訂單激增。
兩名知情人士表示,自DeepSeek上個(gè)月引起全球矚目以來,中國(guó)企業(yè)騰訊、阿里巴巴及字節(jié)跳動(dòng)都“大幅增加”對(duì)H20的訂單。這三家科技巨頭除了內(nèi)部需要先進(jìn)AI芯片外,也提供云計(jì)算服務(wù),讓其他企業(yè)能取得并使用AI工具。
周三美股盤后(北京時(shí)間2月27日凌晨),“宇宙最重要的財(cái)報(bào)”將出爐,“AI芯片霸主”英偉達(dá)將公布截至今年1月底的2025財(cái)年第四季度業(yè)績(jī)報(bào)告,其AI芯片需求成為市場(chǎng)關(guān)注的焦點(diǎn)。
根據(jù)LSEG的數(shù)據(jù),英偉達(dá)第四財(cái)季收入預(yù)計(jì)將激增72%,至380.5億美元,為七個(gè)季度以來的最低增速。而截至今年4月的2026財(cái)年第一季度營(yíng)收預(yù)計(jì)將增長(zhǎng)60%。
校對(duì):楊立林