7月26日至7月28日,世界人工智能大會(WAIC)在上海舉行。陣雨天氣沒有澆息觀眾們的熱情:在世博中心主論壇,人工智能“教父”杰弗里·辛頓的出場吸引了最多的掌聲和眼球;在世博展覽館H3展區(qū),宇樹機器人展臺旁的觀眾圍繞了超過五層,就為了一睹機器人和人類“搏擊”的風采。


穿過熙攘的人群和瀝瀝細雨,新京報貝殼財經(jīng)記者在WAIC召開期間連續(xù)三天走訪展臺及論壇現(xiàn)場,采訪了AI大模型、具身智能、AI應用等行業(yè)的公司高管、項目負責人,以及國內(nèi)外的高校教授、研究者,發(fā)現(xiàn)在“熱鬧”背后,本屆WAIC也反映出了當前人工智能技術(shù)發(fā)展的最新變化——


在展覽館一層觀眾入口處的H1、H2展區(qū),眾多參展大模型企業(yè)進行了“三連發(fā)”甚至“四連發(fā)”的新品發(fā)布,大語言模型迭代速度變得越來越快,正深度進入人們的日常生活;搭乘電梯向上一層,H3展區(qū)的諸多機器人百花齊放,應用領(lǐng)域橫跨工業(yè)、消費、教育等場景,頗有當年“百模大戰(zhàn)”的影子,投資人、產(chǎn)業(yè)鏈供應商穿梭在展臺之間,還能看到許多外國面孔,是當前具身智能處于“風口”的真實寫照。


“這屆展會,讓我印象最深刻的是人工智能加持的教育技術(shù),這對非洲來說非常重要,因為在世界上的一些地方,教師的數(shù)量并不充足,人工智能能夠讓非洲的孩子更好地學習。另外與往年相比,今年的展會有非洲人受邀從非洲視角發(fā)言,這對我們非常重要,因為在人工智能的發(fā)展中,世界各個地區(qū)都應該被納入其中?!?月27日,大會嘉賓、非洲學術(shù)博士全球組織主席歐弟·以利亞在接受新京報貝殼財經(jīng)記者采訪時表示。


非洲學術(shù)博士全球組織主席歐弟·以利亞在世博展覽館H2展區(qū)接受新京報貝殼財經(jīng)記者采訪。


人工智能教父和中國AI同臺 WAIC“激發(fā)”上百款新產(chǎn)品


“杰弗里,今天你的演講屏幕上有實時AI中文翻譯,AI在‘聽著你’呢?!?月26日上午,當辛頓結(jié)束了自己在WAIC主論壇關(guān)于如何讓人工智能在未來學會“成為一個好人”的演講時,外交部原副部長傅瑩和他開玩笑道。


貝殼財經(jīng)記者注意到,主論壇上辛頓演講屏幕上顯示的AI翻譯為“訊飛同傳”。對此,科大訊飛副總裁趙翔告訴記者,實際上在WAIC開幕“前夜”的7月25日,訊飛星火X1升級版剛剛上線,緊接著就運用到了這次大會上,“我認為2025年將是全民AI和全行業(yè)AI的元年,隨著大模型的發(fā)展,終端業(yè)務形態(tài)越來越多。改變世界的不僅僅是技術(shù)本身,更重要的是核心技術(shù)能夠落地到產(chǎn)業(yè)中,才能讓消費者體驗到我們所發(fā)揮的價值。比如在展會或者工廠車間場景,翻譯機的降噪能力很重要,通過硬件和軟件算法的結(jié)合,我們能夠做到把翻譯機一米之外的所有聲音全部隔絕,除了技術(shù)之外,也只有深入理解場景才能更好地掌握這件事?!?/p>

科大訊飛副總裁趙翔在世博中心現(xiàn)場接受記者采訪 新京報貝殼財經(jīng)記者羅亦丹/攝


貝殼財經(jīng)記者注意到,本屆WAIC前后,有眾多企業(yè)發(fā)布了新模型、新產(chǎn)品。根據(jù)大會官方,會議期間發(fā)布的產(chǎn)品數(shù)超過100款。不少企業(yè)趕著大會“熱潮”進行了連續(xù)發(fā)布,如阿里巴巴通義千問團隊接連開源了四款大模型,分別為Qwen3家族的經(jīng)典基礎模型、編程模型、推理模型以及電影級視頻生成模型通義萬相Wan2.2。


7月28日,參會嘉賓、北京諸葛智能CTO文革告訴貝殼財經(jīng)記者,大模型的開源為企業(yè)提供了極大幫助,“我們從2023年4月就開始研究AI落地,但局限于大模型的推理能力,許多事情需要自己摸索,并且面臨人才問題。今年1月DeepSeek開源之后,我們的業(yè)務進度明顯變快了,如果沒有開源模型,我們需要投入更多采購成本,自己摸索的過程也會更加坎坷。這次參會,我們就帶來了通過自然語言交互實現(xiàn)業(yè)務洞察自動化的金融Agent,其策略生成時間從7天壓縮至11分鐘,人工參與度降至9%。”


而對于近期諸多大模型的密集發(fā)布和迭代,由于諸葛智能的產(chǎn)品架構(gòu)適配多模型,文革向貝殼財經(jīng)記者直言,企業(yè)需要服務客戶,選擇適配哪一種大模型,需要從客戶的安全、穩(wěn)定、可用、易用上來考慮,“選擇基礎大模型的標準并不是追求某一個榜單的排名,而是要看它是適用于我們服務的場景,就像一把刀,刀刃可能非常鋒利,但有時場景需要我們使用的恰恰是刀背?!?/p>

北京諸葛智能CTO文革在世博展覽館接受記者采訪 新京報貝殼財經(jīng)記者羅亦丹/攝


“落地”成大模型展商主旋律 適配硬件增多讓生態(tài)更繁榮


貝殼財經(jīng)記者觀察到,“落地”和“場景”成為了本屆WAIC大模型參會展商們最看重的一點。


當前,AI大語言模型的對話能力已經(jīng)司空見慣,因此垂直領(lǐng)域的專業(yè)程度成為了各個大模型產(chǎn)品差異化落地的抓手。在螞蟻展臺,榮獲了本屆大會“鎮(zhèn)館之寶”的健康應用AQ被放在了正中,工作人員向記者介紹,向它咨詢?nèi)魏螁栴},都可以得到全國269位三甲名醫(yī)“AI分身”的即時反饋。仁濟醫(yī)院評估研究顯示,在AI輔助下,基層醫(yī)生診斷正確率提升4%-8%,因此其具備了“下基層”的能力。


而在硬件層面,搭載了AI功能的可穿戴設備成為了有望接班手機市場的未來之星。在Rokid展臺,一個巨大的AR眼鏡異常吸睛,吸引了不少觀眾。除Rokid外,大廠也開始進軍這一領(lǐng)域,阿里巴巴就在WAIC上首次亮相了自研的AI眼鏡——夸克AI眼鏡。阿里巴巴智能信息事業(yè)群終端業(yè)務負責人宋剛表示,AI眼鏡會是智能穿戴方向最重要的產(chǎn)品形態(tài),它將成為人類另一雙“眼睛”和“耳朵”,具備極強的場景穿透能力,“眼鏡一定會成為下一代人機交互的‘感官中樞’,這將催生個人數(shù)據(jù)量的急劇爆發(fā)?!?/p>

7月27日,宇樹機器人走過世博展覽館Rokid展臺,身后跟隨著一大批觀眾 新京報貝殼財經(jīng)記者羅亦丹/攝


記者注意到,夸克、Rokid、小米、雷鳥等品牌的眼鏡還都具備了支付寶的“看一下支付”功能,可不用掏手機就完成付款流程,顯示出了智能可穿戴設備智能化的未來。不過也有佩戴智能眼鏡的用戶在WAIC現(xiàn)場向記者吐槽稱,使用眼鏡拍攝視頻的續(xù)航時間較短,且會發(fā)熱,因此未來還有發(fā)展空間。


“通過長時間的技術(shù)驗證,大模型的應用正在變得越來越廣泛,從互聯(lián)網(wǎng)公司逐步向新消費、消費電子乃至金融和醫(yī)療場景滲透。”7月27日,阿里云百煉高級產(chǎn)品專家徐志遠在接受貝殼財經(jīng)記者采訪時表示。


徐志遠告訴記者,“許多場景和需求早就存在,比如AI大模型結(jié)合IPC(網(wǎng)絡攝像機)落地。但企業(yè)需要考慮的問題很多,如使用端側(cè)模型還是云側(cè)模型,端側(cè)模型是否需要新的芯片和對應配套運行環(huán)境?云側(cè)模型的穩(wěn)定性和連通性又如何?它們的成本又怎樣?從年初至今,我們發(fā)現(xiàn)許多行業(yè)驗證了商業(yè)上的可行性,達到了較好階段,因此今年6月份出現(xiàn)了大量新的硬件、新的電子芯片,這才讓IPC、AI玩具等消費電子領(lǐng)域真正和AI技術(shù)結(jié)合了起來。總結(jié)來說,決定技術(shù)發(fā)展和落地的不是某一個人、某一家公司,而是整個行業(yè)生態(tài)。我注意到,去年來WAIC的大部分是模型公司,而今年還有大量小型芯片公司,這是好事,因為它們能真正驅(qū)動下游產(chǎn)業(yè)的發(fā)展?!?/p>

阿里云百煉高級產(chǎn)品專家徐志遠接受記者采訪 新京報貝殼財經(jīng)記者羅亦丹/攝


國產(chǎn)算力與硬件崛起 新興商業(yè)機會出現(xiàn)


貝殼財經(jīng)記者在本屆WAIC的探展過程中發(fā)現(xiàn),隨著技術(shù)的發(fā)展,許多領(lǐng)域發(fā)生了變革,許多新興的商業(yè)機會也由此產(chǎn)生。


例如,雖然本屆WAIC上并沒有出現(xiàn)DeepSeek的身影,但由于DeepSeek引領(lǐng)了推理模型的發(fā)展,并間接促進了Agent的繁榮,整個AI行業(yè)也因此發(fā)生了改變,不僅影響了下游的應用,還影響到了上游的算力。


“當前,模型推理的需求旺盛,在這一領(lǐng)域,國產(chǎn)芯片已經(jīng)能夠取得不錯的效果。目前,我們已經(jīng)搭建千卡級國產(chǎn)異構(gòu)AI算力混合集群,納管并適配了11款不同類型的國產(chǎn)AI芯片,助力AI技術(shù)產(chǎn)業(yè)化落地與場景化應用拓展。”北電數(shù)智展臺講解人員告訴記者。


在展臺現(xiàn)場,北電數(shù)智還集中展示了覆蓋算力、模型、數(shù)據(jù)的全棧 AI 底座,以及 “星火?大平臺”在醫(yī)療、政務、AIGC、工業(yè)制造、泛家居及新興行業(yè)的最新應用成果?!拔覀兘?jīng)過探索發(fā)現(xiàn),要經(jīng)營好算力中心,只提供硬件服務是不夠的,還需要和應用結(jié)合才能讓國產(chǎn)算力做到最優(yōu)效率,所以我們自研大模型,通過大模型應用適配場景,對外進行AI賦能的同時,也實現(xiàn)了多行業(yè)多場景的應用落地?!敝v解人員說。


在PPIO展臺,貝殼財經(jīng)記者見到了在十幾年前曾一度火爆的PPTV的創(chuàng)始人,現(xiàn)任PPIO派歐云董事長兼CEO姚欣。他向記者介紹,PPIO針對Agent特性的開發(fā)需求,以分布式GPU云底座為支撐,推出了AI智能體平臺產(chǎn)品。


至于為什么采用分布式GPU,姚欣告訴記者,“我們和全國的智算中心合作,將閑置的算力資源無縫連接到我們的平臺,相當于算力版的‘滴滴’,一方面將這些閑置算力進行整合利用提高了算力供應商的售賣率,另一方面也降低了成本。如PPIO專為Agent執(zhí)行任務設計的云端運行環(huán)境產(chǎn)品Agent沙箱,憑借我們?nèi)蚍植际降乃懔W(wǎng)絡,在相同規(guī)格資源單價低至E2B官方定價的50%以下,進一步幫企業(yè)優(yōu)化Agent沙箱成本?!?/p>

PPIO派歐云董事長兼CEO姚欣接受記者采訪 新京報貝殼財經(jīng)記者羅亦丹/攝


“今年我的看展感受是:百花齊放、百家爭鳴。從創(chuàng)業(yè)的角度說,許多企業(yè)都是人工智能的先驅(qū),它們不一定都能取得最后的成功,但在這個過程中,人工智能行業(yè)發(fā)展起來了,最終給社會帶來了價值?!蔽母锔嬖V記者。


具身智能成為新“風口” 但大規(guī)模落地商用仍需時間


根據(jù)WAIC官方數(shù)據(jù),本屆大會的展覽規(guī)模為歷屆以來最大:展覽面積首次突破7萬平方米,吸引了超過800家企業(yè)參展。其中,位于世博展覽館二樓的H3展區(qū)面積最大,機器人企業(yè)多位于此,也吸引了最多人流。


“去年的WAIC沒有這么多機器人?!痹谝劳泄枮I工業(yè)大學團隊成立的具識智能展臺,一位項目經(jīng)理告訴貝殼財經(jīng)記者,“今年展覽館二樓幾乎全是做機器人本體的,還有上下游的產(chǎn)業(yè)、配件,今年以來人形機器人可以說是爆發(fā)式增長?!?/p>


在H3展區(qū),貝殼財經(jīng)記者經(jīng)常能夠看到投資人和產(chǎn)業(yè)鏈上下游企業(yè)洽談投資的身影,顯示出具身智能位于風口之上的火熱。相比于當前大模型正變得越來越“務實”,采訪對象多談及落地的情形,人形機器人和具身智能在當前的應用還無法和工業(yè)機器人相比擬,但更具想像空間。


一位出席論壇的嘉賓向貝殼財經(jīng)記者比喻,“現(xiàn)在具身智能的火熱程度有點像2023年的大模型,或者iPhone尚未流行時期的智能手機,各種品牌扎堆出現(xiàn),正值風口。但當前,人形機器人在軟件和硬件領(lǐng)域都存在大量‘瓶頸’,成為其商業(yè)化的阻礙。”


圍繞風口和痛點,具身智能行業(yè)也出現(xiàn)了大廠身影。7月27日,騰訊 Robotics X 實驗室與福田實驗室聯(lián)合發(fā)布了具身智能開放平臺 Tairos “鈦螺絲”,該平臺的核心功能非常明確:為機器人本體開發(fā)商與應用開發(fā)商補齊關(guān)鍵的軟件能力,讓軟件能力不再成為機器人走向場景落地的瓶頸。平時一直保持低調(diào)的騰訊首席科學家、Robotics X 實驗室主任、福田實驗室主任張正友也出現(xiàn)在了WAIC現(xiàn)場。


張正友研究人工智能和機器人技術(shù)已四十年,他在接受新京報貝殼財經(jīng)記者采訪時表示,過去一段時間團隊走訪了60余家機器人企業(yè),發(fā)現(xiàn)機器人行業(yè)在落地方面需要補足的“短板”還很多,特別是具身智能軟件層面,其實需要比較大的投入,騰訊在這一塊已經(jīng)有多年的沉淀。而且機器人場景,對于軟件和算法的要求也跟通用模型不一樣,以3D模型為例, “這對我們來說不是一張照片變成3D就結(jié)束了的,機器人的世界需要在仿真環(huán)境里能夠操作,這就使得具身智能模型和多模態(tài)模型有很大區(qū)別。”


目前,與具身智能相關(guān)的模型大致分為進行路線規(guī)劃的“大腦”模型和進行行動的“小腦”模型。張正友告訴記者,在規(guī)劃方面,目前大語言模型雖然可以做出規(guī)劃,但其通過文本理解世界,而現(xiàn)實世界的很多東西無法用文字描述,“比如動物不需要人類的語言,也仍然能夠在3D世界里很好地活下來?!痹谛袆臃矫?,進行感知的行動大模型缺乏觸覺感知,目前還沒有達到真正能夠標準化的程度,這需要整個行業(yè)一起努力。

騰訊首席科學家、Robotics X 實驗室主任、福田實驗室主任張正友接受新京報貝殼財經(jīng)記者采訪 受訪者供圖


“從整個生態(tài)層面來看,目前機器人本體存在很多問題,一是穩(wěn)定性需要打磨,一是如果要落地,精度還需提升?!鼻笆鲰椖拷?jīng)理對記者表示,“從我們現(xiàn)場調(diào)試的項目來看,主要問題基本出在機器人硬件上,如果抓取精度準,可能很少的代碼量、工作量甚至很少的模型訓練就能夠讓它完成工作。但現(xiàn)在精度低,穩(wěn)定性也有問題,比如關(guān)節(jié)發(fā)熱、本地上的一些接口頻繁出問題,導致機器人突然斷電、宕機等。所以目前從生態(tài)來看,大模型是第一波,具身智能是第二波,而機器人本體則‘卡’在這里?!?/p>


不過,就像大語言模型火熱之后,市場上逐漸出現(xiàn)了適配大模型的硬件供應商。貝殼財經(jīng)記者在WAIC現(xiàn)場也發(fā)現(xiàn)了許多為機器人企業(yè)供應零部件的供應商。多家供應商展臺的工作人員對記者表示,他們所在的企業(yè)之前主要為工業(yè)機器人提供配件,包括關(guān)節(jié)軸承、電線等,而隨著人形機器人的火熱,他們今年也顯著感受到了這一行業(yè)的發(fā)展?jié)摿?,并正逐步形成共同認知,堅定了投入方向。


“未來,技術(shù)與認知的進步正推動我們從‘割裂的拼接’走向‘有機的融合’——智能不再是塞進去的,而是在與環(huán)境的持續(xù)、閉環(huán)交互中真實涌現(xiàn)出來的。它意味著具身智能需具備強大的泛化能力——這個‘身’與‘智’要能動態(tài)、協(xié)同地進化,無縫地適應多變的環(huán)境,實現(xiàn)身、智、環(huán)境的圓融統(tǒng)一,它不再被束縛于單一功能或固定環(huán)境,而是能在工業(yè)、家庭、醫(yī)療等多種場景中理解開放任務,成為真正意義上的通才。非常幸運,我們正親眼見證著這個‘身智融無礙’的未來在展開?!睆堈颜f。


記者聯(lián)系郵箱:luoyidan@xjbnews.com

新京報貝殼財經(jīng)記者 羅亦丹

編輯 岳彩周

校對 付春愔