阿里云,重大消息傳來。
2月25日晚間,阿里云旗下視覺生成基座模型萬相2.1(Wan)正式開源,此次開源采用最寬松的Apache2.0協(xié)議,14B和1.3B兩個(gè)參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開源,同時(shí)支持文生視頻和圖生視頻任務(wù),全球開發(fā)者可在Github、HuggingFace和魔搭社區(qū)下載體驗(yàn)。
阿里云實(shí)現(xiàn)全模態(tài)、全尺寸大模型開源
據(jù)介紹,14B萬相模型在指令遵循、復(fù)雜運(yùn)動生成、物理建模、文字視頻生成等方面表現(xiàn)突出,在權(quán)威評測集VBench中,萬相2.1以總分86.22%的成績大幅超越Sora、Luma、Pika等國內(nèi)外模型,穩(wěn)居榜首位置。1.3B版本測試結(jié)果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時(shí)能在消費(fèi)級顯卡運(yùn)行,僅需8.2GB顯存就可以生成高質(zhì)量視頻,適用于二次模型開發(fā)和學(xué)術(shù)研究。
在算法設(shè)計(jì)上,萬相基于主流DiT架構(gòu)和線性噪聲軌跡Flow Matching范式,研發(fā)了高效的因果3D VAE、可擴(kuò)展的預(yù)訓(xùn)練策略等。以3D VAE為例,為了高效支持任意長度視頻的編碼和解碼,萬相在3D VAE的因果卷積模塊中實(shí)現(xiàn)了特征緩存機(jī)制,從而代替直接對長視頻端到端的編解碼過程,實(shí)現(xiàn)了無限長1080P視頻的高效編解碼。此外,通過將空間降采樣壓縮提前,在不損失性能的情況下進(jìn)一步減少了29%的推理時(shí)內(nèi)存占用。
萬相團(tuán)隊(duì)的實(shí)驗(yàn)結(jié)果顯示,在運(yùn)動質(zhì)量、視覺質(zhì)量、風(fēng)格和多目標(biāo)等14個(gè)主要維度和26個(gè)子維度測試中,萬相均達(dá)到了業(yè)界領(lǐng)先表現(xiàn),并且斬獲5項(xiàng)第一。尤其在復(fù)雜運(yùn)動和物理規(guī)律遵循上的表現(xiàn)上大幅提升,萬相能夠穩(wěn)定展現(xiàn)各種復(fù)雜的人物肢體運(yùn)動,如旋轉(zhuǎn)、跳躍、轉(zhuǎn)身、翻滾等;能夠精準(zhǔn)還原碰撞、反彈、切割等復(fù)雜真實(shí)物理場景。
從2023年開始,阿里云就堅(jiān)定大模型開源路線。
自2023年8月起,阿里云相繼開源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大語言、多模態(tài)、數(shù)學(xué)和代碼等全模態(tài),多次登上國內(nèi)外權(quán)威榜單,已成為全球開源社區(qū)最重要的模型系列。阿里云千問(Qwen)衍生模型數(shù)量已超過10萬個(gè),是全球最大的AI模型家族。
隨著萬相的開源,阿里云實(shí)現(xiàn)了全模態(tài)、全尺寸大模型的開源。
值得一提的是,自2025年1月DeepSeek火爆出圈至今,開源正在成為國內(nèi)外眾多大模型的“必選項(xiàng)”。今年2月,字節(jié)豆包、昆侖萬維、百度文心、阿里通義千問等均推出開源模型。
投入3800億元建設(shè)云和AI硬件基礎(chǔ)設(shè)施
阿里巴巴集團(tuán)CEO吳泳銘在2月24日宣布,未來三年,阿里將投入超過3800億元,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總額超過去十年總和。這也創(chuàng)下中國民營企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域有史以來最大規(guī)模投資紀(jì)錄。
阿里這筆投入發(fā)生在兩個(gè)重要時(shí)點(diǎn)之后。一是國內(nèi)AI產(chǎn)業(yè)爆發(fā);二是民營企業(yè)座談會召開。吳泳銘表示:“AI爆發(fā)遠(yuǎn)超預(yù)期,國內(nèi)科技產(chǎn)業(yè)方興未艾,潛力巨大。阿里巴巴將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè),助推全行業(yè)生態(tài)發(fā)展。”
此前在2月20日,吳泳銘在財(cái)報(bào)會上表示,阿里將于近期發(fā)布基于千問Qwen2.5-MAX的深度推理模型。1月底,阿里發(fā)布了AI基礎(chǔ)大模型千問旗艦版Qwen2.5-Max,在多項(xiàng)權(quán)威基準(zhǔn)評測中,處于業(yè)界領(lǐng)先水平。目前,Qwen的全球衍生模型已突破9萬個(gè),全球排名第一。
2月25日,通義千問官方賬號Qwen在海外社交平臺發(fā)布了QwQ-Max-Preview(推理模型預(yù)覽版),即將發(fā)布QwQ-Max正式版本、可部署在本地的較小版本以及官方App QwQ-Max。
Qwen同時(shí)宣布,即將發(fā)布QwQ-Max的正式版本,將在Apache 2.0許可下開源QwQ-Max和 Qwen2.5-Max。此外,還將提供規(guī)模較小的版本,例如 QwQ-32B,可部署在本地設(shè)備上。另外,將在發(fā)布官方QwQ-Max的同時(shí)發(fā)布安卓和iOS App。
目前,阿里云是亞洲第一的云計(jì)算公司,阿里巴巴通義千問大模型已成為全球頂尖的開源模型。3800億元巨額資金繼續(xù)投入,能極大提振相關(guān)產(chǎn)業(yè)信心,同時(shí)也表明阿里一如既往相信未來、投資未來。