2024年12月20日,江蘇南京,在世界智能制造大會宇樹科技展臺前,觀眾爭相與人形機(jī)器人握手互動
宇樹科技Unitree G1人形智能體
傅利葉通用人形機(jī)器人GR-2
優(yōu)必選人形機(jī)器人
GR-2靈活的上肢操作
1月24日,國家地方共建具身智能機(jī)器人創(chuàng)新中心研發(fā)的“天工”機(jī)器人在戶外跑道奔跑
優(yōu)必選人形機(jī)器人
GR-2實(shí)現(xiàn)更靈活的上肢操作
◎記者 孫小程
具身智能賽道再迎巨頭入局。近日,螞蟻集團(tuán)在招聘平臺開放了多個具身智能方向崗位。有業(yè)內(nèi)人士向上海證券報(bào)記者透露,螞蟻集團(tuán)2024年時便已在推進(jìn)具身智能相關(guān)業(yè)務(wù)。螞蟻集團(tuán)官方對此回應(yīng)稱,集團(tuán)持續(xù)布局和加大人工智能(AI)投入,去年注冊成立了螞蟻靈波科技有限公司,聚焦具身智能技術(shù)和產(chǎn)品研發(fā)。
近年來,各路大語言模型的“全面開花”,也讓具身智能熱浪再起,人形機(jī)器人則有望“飲得頭啖湯”,率先成為具身智能的具體形態(tài)。而憑借低成本、高效率脫穎而出的DeepSeek,正在為此“再添一把火”。
在接受記者采訪時,國家地方共建人形機(jī)器人創(chuàng)新中心總經(jīng)理許彬表示:“人形機(jī)器人主要是具身操作大模型,之前方向不清晰,成本太高,很多人望而卻步?,F(xiàn)在會有更多人去嘗試,優(yōu)化模型架構(gòu)、訓(xùn)練方式,肯定會加速應(yīng)用?!?/p>
具身智能熱浪再起
具身智能與人形機(jī)器人相互關(guān)聯(lián)但又存在差異,時常被混為一談。與人形機(jī)器人相比,具身智能是一個更寬泛的概念,是基于物理身體(智能體)進(jìn)行感知和行動的智能系統(tǒng)。具身智能核心在于“身體與智能的結(jié)合”,更強(qiáng)調(diào)AI的加持。
自2024年以來,具身智能初創(chuàng)企業(yè)的融資頗為火熱,星動紀(jì)元、星海圖、千尋智能等一眾企業(yè)陸續(xù)宣布獲得新一輪融資。2月17日,自變量機(jī)器人宣布完成數(shù)億元Pre-A++輪融資。在自變量機(jī)器人創(chuàng)始人兼CEO王潛看來,當(dāng)下的具身智能幾乎可以類比到GPT-2所處的時間點(diǎn)。預(yù)計(jì)2025年年底或者2026年年初,會出現(xiàn)一個類似GPT-3級別的具身智能大模型。
當(dāng)前來看,具身智能賽道已成“群雄逐鹿”之勢。在螞蟻集團(tuán)傳出布局具身智能賽道動向之前,已有多家巨頭率先入局。
記者梳理發(fā)現(xiàn),當(dāng)前大廠主要通過戰(zhàn)略投資、大模型接入等方式切入具身智能領(lǐng)域,親身下場自研的尚屬“少數(shù)派”。例如,阿里旗下的杭州灝月企業(yè)管理有限公司參與了逐際動力的戰(zhàn)略融資;美團(tuán)曾投資銀河通用、宇樹科技;騰訊在多年前投資了樂聚機(jī)器人和優(yōu)必選。
2024年11月,華為(深圳)全球具身智能產(chǎn)業(yè)創(chuàng)新中心宣布正式運(yùn)營,致力于推動具身智能技術(shù)的國際前沿發(fā)展。會上,華為具身智能中心與16家企業(yè)簽署合作備忘錄,涵蓋樂聚機(jī)器人、拓斯達(dá)、兆威機(jī)電等多家科技企業(yè),聯(lián)合企業(yè)協(xié)同創(chuàng)新,提供一站式產(chǎn)品技術(shù)交易服務(wù),助力全球具身智能產(chǎn)業(yè)鏈的集散與升級。
上市公司亦在“趕潮”。2月19日,中堅(jiān)科技在調(diào)研紀(jì)要中表示,公司出席了H公司(深圳)全球具身智能產(chǎn)業(yè)創(chuàng)新中心企業(yè)合作備忘錄簽約儀式,并簽署企業(yè)合作備忘錄。近期,公司成立了深圳樺之堅(jiān)機(jī)器人科技有限公司,目前合作正在進(jìn)一步對接和推進(jìn)中。
天奇股份此前公告稱,公司與北京銀河通用機(jī)器人有限公司簽署《合資公司投資協(xié)議》,雙方擬出資設(shè)立合資公司天奇銀河機(jī)器人有限公司,整合雙方優(yōu)勢及資源,就具身智能大模型及具身智能機(jī)器人在汽車制造產(chǎn)業(yè)相關(guān)領(lǐng)域規(guī)?;瘧?yīng)用方面展開戰(zhàn)略合作。
大模型成為“加速器”
與以往相比,本輪具身智能熱潮的推動力來自哪里?
“ChatGPT從根本上改變了AI整個領(lǐng)域,對機(jī)器人來說有兩點(diǎn):一是很多以前覺得極其困難的問題獲得了突飛猛進(jìn)的發(fā)展,例如Planning(規(guī)劃)、Reasoning(推理)、Language Interaction(語言交互);二是從方法論上指明了解決機(jī)器人通用操作這一最核心問題的路線?!蓖鯘撜f。
北京一位具身智能企業(yè)的高管同樣認(rèn)為,ChatGPT在推理能力率先實(shí)現(xiàn)“質(zhì)”的突破,這對人形機(jī)器人而言極為關(guān)鍵。以機(jī)器人的行走為例,針對一些需要經(jīng)過思考才能完成的慢速動作以及任務(wù)規(guī)劃,可以在訓(xùn)練時借助大模型的技術(shù),進(jìn)一步提高人形機(jī)器人的通用性和泛化性。
在業(yè)內(nèi)看來,以DeepSeek為代表的大模型,有望加速人形機(jī)器人的“進(jìn)化”。近期DeepSeek憑借低成本、高效率而全球出圈,各個行業(yè)均在研判其間機(jī)遇,多家人形機(jī)器人企業(yè)也在嘗試DeepSeek的應(yīng)用可能。
人形機(jī)器人“第一股”優(yōu)必選透露,正在驗(yàn)證DeepSeek技術(shù)在人形機(jī)器人應(yīng)用場景中的有效性,包括多模態(tài)人機(jī)交互、復(fù)雜環(huán)境下的指令理解、工業(yè)場景中的任務(wù)分解與規(guī)劃等。公司希望借助推理大模型的深度思考能力,破解這些復(fù)雜任務(wù)的挑戰(zhàn),使人形機(jī)器人更接近人類的思維方式和行為表現(xiàn)。
均普智能也已在具身智能的研發(fā)及應(yīng)用領(lǐng)域應(yīng)用DeepSeek模型。目前,均普智能已將微調(diào)過的小參數(shù)DeepSeek-R1模型部署至機(jī)器人的端側(cè)。更新后,模型應(yīng)用的復(fù)雜指令規(guī)劃性能提升了40%,幻覺出現(xiàn)概率降低了20%,同時具有更好的思維發(fā)散程度、上下文聯(lián)想能力和中文語言表述能力,具身智能機(jī)器人的訓(xùn)練效率大幅提升。
均普人工智能與人形機(jī)器人研究院院長兼首席科學(xué)家郭繼舜博士介紹,除V3、R1外,DeepSeek團(tuán)隊(duì)也開發(fā)了系列大模型,如已具備較好視覺語義對話能力的大型混合專家(MoE)視覺-語言模型系列,這將顯著提升人形機(jī)器人的“大腦”水平。
宇樹科技CEO王興興近日表示,AI驅(qū)動下的機(jī)器人技術(shù)每天都在快速進(jìn)步,大大加速了技術(shù)的發(fā)展。他預(yù)計(jì),到2025年年底之前,AI人形機(jī)器人將達(dá)到一個新的量級。如果順利的話,到明年或后年,AI機(jī)器人可以在一些基礎(chǔ)的服務(wù)業(yè)或工業(yè)應(yīng)用推廣起來,但家用機(jī)器人可能會稍微慢一點(diǎn),因?yàn)榧矣脤Π踩缘囊蟾?,需要技術(shù)相對更成熟。