ag官方网站登录入口-ag官方网站登录入口 智平方郭彦东:宇宙模子不是VLA的竞争门道

2026世界杯 /

你的位置:ag官方网站登录入口 > 2026世界杯 > ag官方网站登录入口 智平方郭彦东:宇宙模子不是VLA的竞争门道
ag官方网站登录入口 智平方郭彦东:宇宙模子不是VLA的竞争门道
发布日期:2026-06-16 20:12    点击次数:132

ag官方网站登录入口 智平方郭彦东:宇宙模子不是VLA的竞争门道

kaiyun体育中国2026世界杯入口

2026年6月的北京智源大会,具身智能专场的热度彰着压过了历届。40余位CEO同台,千寻智能估值超百亿,灵心巧手寻求400亿估值——成本的热度仍在。但比融资数字更张惶的,是一方位手续一年的本事门道之争:VLA(Vision-Language-Action)与宇宙模子(World Model),究竟是替代忖度,如故交融忖度?

智平方独创东谈主兼CEO郭彦东在具身产业CEO论坛上给出了他的谜底:宇宙模子不是VLA的竞争门道,而是VLA体系中的中枢构成部分。

这一判断试图为争论降温,但现场的本事不对并未因此消弭。

一、"交融论"的建议:从对立到调解

夙昔一年来,具身智能规模的本事门道分化彰着。VLA派主张"径直映射"——将视觉、话语、作为调解在端到端大模子中,输入图像和教导,径直输移作为序列。其上风在于语义领略才略强,能通过当然话语齐全绽放教导交互。

宇宙模子派则主张"先展望、后扩充"——让机器东谈主在行动前先在"脑中"模拟物理服从,再作念出决策。不少商酌者觉得,机器东谈主只须先成立对物理宇宙的领略才略,能力产生可靠行径。

郭彦东的切入角度是生物演化。他觉得,行动才略从来不是安详产生的,人命最初需要感知环境、领略环境,然后才谈得上行动。因此,宇宙模子认真领略宇宙,VLA认真作用于宇宙,两者并非对立,而是"自然调解的全体"。

基于这一逻辑,他重新界说了VLA:VLA是多种模态交融、大数据运转的端到端模子架构的总称。 在这一框架下,宇宙模子处分的是对物理环境的茂密4D展望(含时刻维度),是VLA空间感知才略的构成部分,而非替代者。

"淌若不把宇宙模子合并在VLA内部,许多任务绝对作念不了。"郭彦东例如称,沏茶需要先拿茶包再倒水,这类长程任务缠绵依赖话语模子;而水杯聚拢桌边可能掉落,这类短程物理展望则依赖宇宙模子。只须两者合并,机器东谈主能力同期处理长程缠绵与短程展望。

此外,智平方还尝试用宇宙模子生成果真环境中难以收罗的角落数据(corner case),补足VLA的考试样本。

二、从Video2Act到NeuroVLA:类脑架构的落地

智平方的本事演进旅途,有时踩在这条"交融"线上。2025年11月,智平方与北京大学搭伙发布Video2Act架构,尝试将4D宇宙模子镶嵌VLA,使机器东谈主在行动前预判气象变化,再将预判径直升沉为作为。据公开信息,该责任在第三方评测中推崇优于部分硅谷同类决策,并取得了包括英国皇家两院院士Philip Torr、强化学习奠基东谈主之一Pieter Abbeel等学者的柔软。

而在本届智源大会上,智平方进一步发布了类脑具身智能系统NeuroVLA。郭彦东建议,现时行业"天天想着如何长得像东谈主,但莫得东谈主想如何让脑子更像东谈主"。

NeuroVLA的架构模仿了东谈主类大脑的单干机制:皮层认真语义领略和任务缠绵,小脑认真高频畅通结合与动态修正,脊髓认真毫秒级畅通扩充与安全反射。据智平方露馅的数据,该架构可将机器东谈主畅通抖动镌汰75%以上,在碰撞发生后20毫秒内完成反射反馈,同期镌汰系统功耗。

从工程角度看,这一分层遐想如实回话了现时VLA架构的某些痛点——调解大模子同期处理感知、推理与收尾,时常导致反馈慢、能耗高、作为抖动。NeuroVLA通过"类脑"分层,AG官方最新版app下载在架构层面尝试解耦不同时间圭臬的任务。

三、门道之争真的"闭幕"了吗?

然则,"交融论"是否意味着VLA与宇宙模子的争论照旧斥逐?现场的反馈并不一致。

一方面,交融想路在工程层面具有求不二价值。对于现时急需居品落地的机器东谈主骨子公司而言,VLA提供了可部署的管谈,宇宙模子提供了空间展望才略,两者结合如实能进步短期内的任务推崇。

但另一方面,这种"合并"也激勉了对于范式层级的商榷。 有商酌者觉得,将宇宙模子界说为"VLA的构成部分",实验上是在用1.0的框架(端到端作为生成)去收编2.0的想法(物理宇宙的孤独建模)。宇宙模子的终极指向,究竟是做事于机器东谈主作为的"空间感知模块",如故成为不依赖骨子的通用物理AI基模?这一问题并未因"交融论"而消解。

事实上,在智源大会的其他表情,不同门道的不对依然彰着。智源商酌院发布的悟界·Physis-v0.1,试图以"调解物理气象学习"杰出话语/像素/三维/视觉表征四条门道,在原始物理气象层面作念展望。而由图灵奖得主Yann LeCun与纽约大学谢赛宁主导的AMI Labs,则主张JEPA(Joint Embedding Predictive Architecture)框架——宇宙模子不应在原始像素空间展望,而应在综合的表征空间推演物理变化,其标的并非生成作为,而是构建可泛化的物理领略。

这些旅途与智平方的NeuroVLA酿成了奥妙对照:前者试图从物理AI的底层重新界说展望逻辑,后者则是在现存VLA架构内优化作为扩充的自如性与及时性。两者并非统一层面的竞争,却分享着"宇宙模子"这一想法标签。

四、行业疑望:想法交融与买卖现实的距离

值得注重的是,现时宇宙模子的公开落地才略,与行业期待之间仍存在落差。郭彦东在演讲中也坦言,当下被日常商榷的宇宙模子,"实验上并不是物理轨则运转,而是靠海量数据考试出来的"——数据弥散多,模子就知谈水杯会下降,但这不是物理轨则的回想,而是大数据学习的收尾。

这意味着,现时所谓的"宇宙模子",更多是数据运转的统计有关,而非真确的因果推理。 将其镶嵌VLA,能在特定场景下进步推崇,但是否具备跨场景泛化的"物理领略",仍需更多考证。

此外,类脑架构的工程化也靠近挑战。东谈主类大脑的分层机制经由数亿年演化,而机器东谈主大脑的"皮层-小脑-脊髓"分层,如安在不同硬件平台、不同任务负载下保合手自如协同,现在公开的考证数据仍然有限。智平方露馅的抖动镌汰75%、20毫秒反射反馈等想法,属于实验室或特定场景下的收尾,大范围工业部署中的推崇尚待不雅察。

智平方在智源大会上建议的"交融论",为VLA与宇宙模子的门道之争提供了一个求实的工程出口。对于贫乏需要居品落地的具身智能产业而言,这种"先合并、再优化"的想路,大略比恭候范式绝对拘谨更现实。

但将宇宙模子"合并"进VLA,是否等同于"闭幕"了门道之争?谜底可能是抵赖的。在物理AI的更长图景中,宇宙模子究竟是VLA的一个子模块,如故下一代东谈主工智能的孤独基座ag官方网站登录入口,这一问题的谜底,将决定具身智能是停留在"更好的机器东谈主"层面,如故迈向"真确的物理领略"层面。