ag官方网站登录入口智平方郭彦东：宇宙模子不是VLA的竞争门道

2026世界杯 /

你的位置：ag官方网站登录入口 > 2026世界杯 > ag官方网站登录入口智平方郭彦东：宇宙模子不是VLA的竞争门道

发布日期：2026-06-16 20:12 点击次数：132

ag官方网站登录入口智平方郭彦东：宇宙模子不是VLA的竞争门道

kaiyun体育中国2026世界杯入口

2026年6月的北京智源大会，具身智能专场的热度彰着压过了历届。40余位CEO同台，千寻智能估值超百亿，灵心巧手寻求400亿估值——成本的热度仍在。但比融资数字更张惶的，是一方位手续一年的本事门道之争：VLA（Vision-Language-Action）与宇宙模子（World Model），究竟是替代忖度，如故交融忖度？

智平方独创东谈主兼CEO郭彦东在具身产业CEO论坛上给出了他的谜底：宇宙模子不是VLA的竞争门道，而是VLA体系中的中枢构成部分。

这一判断试图为争论降温，但现场的本事不对并未因此消弭。

一、"交融论"的建议：从对立到调解

夙昔一年来，具身智能规模的本事门道分化彰着。VLA派主张"径直映射"——将视觉、话语、作为调解在端到端大模子中，输入图像和教导，径直输移作为序列。其上风在于语义领略才略强，能通过当然话语齐全绽放教导交互。

宇宙模子派则主张"先展望、后扩充"——让机器东谈主在行动前先在"脑中"模拟物理服从，再作念出决策。不少商酌者觉得，机器东谈主只须先成立对物理宇宙的领略才略，能力产生可靠行径。

郭彦东的切入角度是生物演化。他觉得，行动才略从来不是安详产生的，人命最初需要感知环境、领略环境，然后才谈得上行动。因此，宇宙模子认真领略宇宙，VLA认真作用于宇宙，两者并非对立，而是"自然调解的全体"。

基于这一逻辑，他重新界说了VLA：VLA是多种模态交融、大数据运转的端到端模子架构的总称。在这一框架下，宇宙模子处分的是对物理环境的茂密4D展望（含时刻维度），是VLA空间感知才略的构成部分，而非替代者。

"淌若不把宇宙模子合并在VLA内部，许多任务绝对作念不了。"郭彦东例如称，沏茶需要先拿茶包再倒水，这类长程任务缠绵依赖话语模子；而水杯聚拢桌边可能掉落，这类短程物理展望则依赖宇宙模子。只须两者合并，机器东谈主能力同期处理长程缠绵与短程展望。

此外，智平方还尝试用宇宙模子生成果真环境中难以收罗的角落数据（corner case），补足VLA的考试样本。

二、从Video2Act到NeuroVLA：类脑架构的落地

智平方的本事演进旅途，有时踩在这条"交融"线上。2025年11月，智平方与北京大学搭伙发布Video2Act架构，尝试将4D宇宙模子镶嵌VLA，使机器东谈主在行动前预判气象变化，再将预判径直升沉为作为。据公开信息，该责任在第三方评测中推崇优于部分硅谷同类决策，并取得了包括英国皇家两院院士Philip Torr、强化学习奠基东谈主之一Pieter Abbeel等学者的柔软。

而在本届智源大会上，智平方进一步发布了类脑具身智能系统NeuroVLA。郭彦东建议，现时行业"天天想着如何长得像东谈主，但莫得东谈主想如何让脑子更像东谈主"。

NeuroVLA的架构模仿了东谈主类大脑的单干机制：皮层认真语义领略和任务缠绵，小脑认真高频畅通结合与动态修正，脊髓认真毫秒级畅通扩充与安全反射。据智平方露馅的数据，该架构可将机器东谈主畅通抖动镌汰75%以上，在碰撞发生后20毫秒内完成反射反馈，同期镌汰系统功耗。

从工程角度看，这一分层遐想如实回话了现时VLA架构的某些痛点——调解大模子同期处理感知、推理与收尾，时常导致反馈慢、能耗高、作为抖动。NeuroVLA通过"类脑"分层，AG官方最新版app下载在架构层面尝试解耦不同时间圭臬的任务。

三、门道之争真的"闭幕"了吗？

然则，"交融论"是否意味着VLA与宇宙模子的争论照旧斥逐？现场的反馈并不一致。

一方面，交融想路在工程层面具有求不二价值。对于现时急需居品落地的机器东谈主骨子公司而言，VLA提供了可部署的管谈，宇宙模子提供了空间展望才略，两者结合如实能进步短期内的任务推崇。

但另一方面，这种"合并"也激勉了对于范式层级的商榷。有商酌者觉得，将宇宙模子界说为"VLA的构成部分"，实验上是在用1.0的框架（端到端作为生成）去收编2.0的想法（物理宇宙的孤独建模）。宇宙模子的终极指向，究竟是做事于机器东谈主作为的"空间感知模块"，如故成为不依赖骨子的通用物理AI基模？这一问题并未因"交融论"而消解。

事实上，在智源大会的其他表情，不同门道的不对依然彰着。智源商酌院发布的悟界·Physis-v0.1，试图以"调解物理气象学习"杰出话语/像素/三维/视觉表征四条门道，在原始物理气象层面作念展望。而由图灵奖得主Yann LeCun与纽约大学谢赛宁主导的AMI Labs，则主张JEPA（Joint Embedding Predictive Architecture）框架——宇宙模子不应在原始像素空间展望，而应在综合的表征空间推演物理变化，其标的并非生成作为，而是构建可泛化的物理领略。

这些旅途与智平方的NeuroVLA酿成了奥妙对照：前者试图从物理AI的底层重新界说展望逻辑，后者则是在现存VLA架构内优化作为扩充的自如性与及时性。两者并非统一层面的竞争，却分享着"宇宙模子"这一想法标签。

四、行业疑望：想法交融与买卖现实的距离

值得注重的是，现时宇宙模子的公开落地才略，与行业期待之间仍存在落差。郭彦东在演讲中也坦言，当下被日常商榷的宇宙模子，"实验上并不是物理轨则运转，而是靠海量数据考试出来的"——数据弥散多，模子就知谈水杯会下降，但这不是物理轨则的回想，而是大数据学习的收尾。

这意味着，现时所谓的"宇宙模子"，更多是数据运转的统计有关，而非真确的因果推理。将其镶嵌VLA，能在特定场景下进步推崇，但是否具备跨场景泛化的"物理领略"，仍需更多考证。

此外，类脑架构的工程化也靠近挑战。东谈主类大脑的分层机制经由数亿年演化，而机器东谈主大脑的"皮层-小脑-脊髓"分层，如安在不同硬件平台、不同任务负载下保合手自如协同，现在公开的考证数据仍然有限。智平方露馅的抖动镌汰75%、20毫秒反射反馈等想法，属于实验室或特定场景下的收尾，大范围工业部署中的推崇尚待不雅察。

智平方在智源大会上建议的"交融论"，为VLA与宇宙模子的门道之争提供了一个求实的工程出口。对于贫乏需要居品落地的具身智能产业而言，这种"先合并、再优化"的想路，大略比恭候范式绝对拘谨更现实。

但将宇宙模子"合并"进VLA，是否等同于"闭幕"了门道之争？谜底可能是抵赖的。在物理AI的更长图景中，宇宙模子究竟是VLA的一个子模块，如故下一代东谈主工智能的孤独基座ag官方网站登录入口，这一问题的谜底，将决定具身智能是停留在"更好的机器东谈主"层面，如故迈向"真确的物理领略"层面。

上一篇：AG国际登录网址 “军国凶铃”再响！高市早苗又“拜”又闹，没完毕？｜漫点看

下一篇：没有了

推荐资讯