雨天中,當一輛智能網聯汽車駛過人車匆忙穿行、情況復雜的路口,它“看到”的不僅是自身傳感器捕捉到的模糊影像,還有“AI大腦”提供的上帝視角,實時計算著視野盲區之外的最優通行路線和風險規避策略,此外,這個“AI大腦”還能讓城市交通管理者輕松掌握所轄區域內的交通系統全局情況,做出更及時、更科學的分析預測和調控指揮。
這不是5-10年后的暢想,而是已在上海嘉定區落地的真實應用案例,背后的技術方案來自蘑菇車聯。
近日,WAIC 2025展會期間,蘑菇車聯對外發布了首個物理世界認知模型——MogoMind,成為本屆大會中備受關注的人工智能技術應用之一,有趣的是,其展位與美國自動駕駛代表特斯拉緊鄰,兩種不同的自動駕駛發展范式交相呼應。
進入2025年以來,“世界模型”已成為AI頭部玩家必爭之地,國際廠商如英偉達、谷歌、Meta、World Labs等紛紛從不同技術維度出發大力推動AI從數字世界向真實物理世界邁進,蘑菇車聯的MogoMind有何獨特之處?又能為行業帶來怎樣的創新價值?
補上“世界模型”的一大缺口
在發展多年的自動駕駛領域,讓車輛準確感知周圍環境,預測未來事件并評估其影響力對于安全性、通行效率和實時決策至關重要。
盡管隨著AI技術的發展如今的大模型都已經非常智能,例如OpenAI的GPT
、谷歌Gemini、DeepSeek等等,一些領先模型在多模態分析處理方面也很強,但它們的能力都僅限于數字世界,無法通過互聯網數據去預測實時變化的現實物理世界,在這樣的背景之下,世界模型由于其理解物理環境并具備與環境交互的能力,被視為是自動駕駛領域的一種變革性方法,通過模擬人類感知和決策過程,讓車輛擁有預測和適應動態環境的本領。
不少業內人士認為,未來5~10年內想要真正實現無人駕駛的大規模普及,世界模型是必然技術路徑。
業內的一部分世界模型研究起初聚焦在游戲環境和模擬環境領域,后來逐漸向工業級物理AI方向邁進。
如OpenAI推出的Sora模型被視為是“物理世界模擬器”,其核心能力突破了傳統視頻生成工具范疇,在物體動力學、流體力學、空間幾何一致性方面表現出色,支持實時調整物理參數(如重力、摩擦力、材料屬性等),逐漸在自動駕駛、工業設計等硬核領域開啟了數字孿生的應用。
截至目前,國內外眾多車企和自動駕駛供應商都紛紛公開表示引入“世界模型”技術,一般而言,主要用于四個方面:
1、長尾數據生成,世界模型可以生成包含極端環境、交通路況、行人和車輛的特殊偶發場景,彌補訓練中真實數據缺少的問題;2、通過物理規律建模、多模態交互與動態環境模擬,為對抗樣本的生成、防御和物理世界攻擊驗證提供系統性解決方案;3、閉環仿真測試,驗證系統在仿真虛擬環境中閉環運行的能力,縮短研發周期降低真實路測成本;4、世界模型通過自監督學習、無監督強化學習等技術,能夠高效利用無標注數據提升復雜場景下的泛化能力。
不過,這些模型大多圍繞車輛本體的數據訓練,例如特斯拉提出的世界模型整合了游戲引擎仿真技術,利用合成數據訓練FSD自動駕駛系統,減少對真實路測數據的依賴,但這仍缺乏對宏觀超視距交通情況判斷和真實世界實時駕駛情景的理解,而蘑菇車聯的MogoMind算是補上了這一行業缺口。
據了解,在模型訓練數據方面,蘑菇車聯通過部署自研的通感算AI數字道路基站設備,能夠毫秒級捕捉道路上車輛行駛軌跡、速度變化、交通流量、行人動態等實時動態數據,此外,還有旗下自動駕駛車輛的多種車端感知設備數據,以及融合智慧交通攝像頭、車路云系統、V2X通信等傳統交通基建系統,實時采集了更立體化多維度的全城交通數據。
在此基礎上,MogoMind通過深度整合實時、海量的多模態交通數據,能夠從物理世界的復雜數據中抽取意義、從經驗中學習規則、在不同場景中靈活決策,形成對交通環境的全局感知、深度認知和實時推理決策能力,這樣可以為智能汽車提供實時數字孿生與深度理解服務,讓自動駕駛車輛突破“單點智能”向“全局智能”邁進,從“各自為戰”變為“協同共生”。
一個多面手的“數字基座”
與其他世界模型對比來看,MogoMind算是首個能實時理解物理世界的一款獨特世界模型,或將進一步拓展當下自動駕駛技術和應用的能力邊界。
據蘑菇車聯方面介紹,MogoMind模型參數大小僅有70億,但其感知精度和認知準確度超過90%,多模態推理準確率大于88%,該模型的六大核心能力與其他世界模型形成了顯著區別和優勢互補:
1、交通數據流實時全局感知。 部署在路口的通感算一體化設備可以全天候、不間斷捕捉車輛行駛軌跡、速度變化、交通流量、行人動態等海量異構數據,MogoMind能快速整合、分類和標準化這些數據,提取其中的關鍵要素,為分析和決策提供依據,據悉,該模型能夠推演的交通場景數量超過800個。
2、物理信息認知理解。 相對于數字世界,物理世界的多模態信息理解更為復雜,包含路面狀況、交通標識、天氣變化、臨時施工或突發交通事故等等,MogoMind能對這些多源數據進行深度融合分析和理解,例如,前方視距之外有臨時施工路障,模型能迅速識別并給到車輛合理的變道預判或繞行方案,亦或是暴雨天路段開始積水,模型可結合歷史事故數據評估潛在通行風險,向交管部門或出行者提供疏導建議。
3、通行能力實時推理計算。 在城市交通早晚高峰階段或突發事故發生時,MogoMind能迅速分析評估出該路段的通行能力變化趨勢和擁堵情況,讓交通管理者提前預判并采取更科學的應對措施。
4、最優路徑實時自主規劃。 基于對路面多維信息的實時感知、理解和推理,MogoMind可以做出精準度更高的路況預判,幫助車輛提前規劃最佳的安全高效行駛路徑,而不是被動應對路況問題。
5、交通環境實時數字孿生。 基于多維度全量實時交通數據,MogoMind可以構建起對現實交通環境精準映射的數字孿生環境,而且可交互可模擬能用于仿真實驗,假設城市管理者要落實新的道路管控策略,可以模擬出實施效果和潛在未知問題,讓決策從過往經驗驅動變成科學數據決策驅動。
6、道路風險實時預警提醒。 一旦識別到路上的風險事件,如個別車輛開始異常行駛、交通流量突變或道路設施損壞,MogoMind能迅速判斷風險類型和嚴重程度,并通過多渠道(如手機APP、車載終端、車聯網系統等)向交管部門、汽車駕駛者等發出實時預警信息。
據悉,在實際的落地案例中,MogoMind對長尾場景處理綜合準確率在85%以上,對于交通管理提效比例超過35%,目前已在北京、上海、沈陽、長春、鄂爾多斯、桐鄉、南京、無錫、武漢、廣州等多個城市區域進行落地驗證和實地部署,讓當地整體交通情況大幅改善,此外,搭載MogoMind系統的L4級RoboBus,在全國10個省份落地運營,安全行駛里程突破200萬公里,服務乘客超過20萬人次。
加速萬億市場崛起的“新飛輪”
整體來看,MogoMind世界模型的本質是賦予了車輛更加實時深度“理解真實世界”的能力,其價值不僅在于提升單個智能車輛的駕駛安全性,更有望重構整個智能交通系統的底層邏輯。
對于交通管理者而言它可以是“科學決策中樞”,對于智能車輛而言它可以是擁有上帝視角的“AI領航員”,對于自動駕駛技術向L4邁進它則是更好的“數字基座”,無論是to G、to B還是to C,似乎都有著廣泛的應用空間可以拓展。
未來的自動駕駛世界,需要的不是廠商之間針鋒相對的孤立競爭,更多的是車路協同技術生態大融合。
據了解,蘑菇車聯致力于將MogoMind打造成一個開放的兼容性和可擴展性平臺,使之能夠無縫接入來自不同廠商、不同類型的交通設備與系統,包括道路傳感器、車載終端、交通管理軟件等,進而對多元異構數據進行統一管理和分析處理。
此外,該模型還提供標準化接口,車企也可以接入MogoMind進行功能適配與應用開發,類似智能網聯汽車的“安卓系統”,讓車企跳過對世界大模型的額外研發投入,更加聚焦產品和應用,專注于用戶體驗和服務的改進,政府部門、交管部門、車企等都能在MogoMind上找到適合自身需求的應用場景,實現資源共享、優勢互補,共同助推AI科技與交通生態真正有機融合發展。
放眼未來,除了智能汽車和自動駕駛,MogoMind世界模型的核心能力據悉也可延伸與無人機、具身機器人等結合,在低空經濟和無人配送等領域發揮巨大技術想象空間。
隨著新質生產力的滲透,中國正催生出多個新興的萬億級市場,相關行業研報顯示,中國正在成為全球首個實現L3級智駕車輛大規模商用的國家,而大規模L4乃至L5級別的無人駕駛應用或將在未來5年左右落地,隨著產業鏈成熟和硬件成本的下降,自動駕駛的普及速度正在加快,預計2025年市場規模將突破3000億元,年復合增長率達30%-40%,到2030年,市場規模有望達到1.2萬億元。
此外,2025年我國低空經濟的市場規模有望達到1.5萬億元,到2035年有望增長至3.5萬億元,而具身智能機器人市場規模到2030年預計也將會達到1.55萬億元,市場前景可謂十分廣闊。
從大模型到協同網絡的實踐,從感知到認知的演進,是構建智能出行生態的關鍵路徑,從長遠來看,蘑菇車聯圍繞MogoMind的技術實踐獲得了一個絕佳的產業生態位,有望為萬億級新興市場的崛起提供加速增長飛輪。
當每輛車不再是信息孤島,當道路開始學會思考,當城市交通流得以全局優化,我們迎來的不僅是更安全、更高效的智駕出行體驗,一個以數據和AI技術協同驅動的全新交通文明形態也已然不遠。
免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發布,可與本網聯系,本網視情況可立即將其撤除。