5月29日,WorldArena世界模型评测榜单最终结果正式公布,同济大学计算机科学与技术学院空间智能团队主导研发的“无界”世界模型实现开源与闭源模型的全球同步领先。其中,开源模型BLM在世界模型权威榜单WorldArena Track-1(视频质量赛道)中取得64.54分,位列全球开源模型第1名;闭源模型BWM-Fast在同一赛道中取得67.87分,位列总榜全球第2名,距离榜首仅差0.39分,展现出卓越的综合性能与竞争优势。这一成果由同济大学计算机科学与技术学院院长、欧洲科学院外籍院士、ACM/IEEE/OSA Fellow申恒涛教授牵头,国家级青年人才朱磊及其团队共同完成,不仅体现了团队在世界模型方面的领先优势,也表明其已形成系统性技术路线与全栈能力体系,进一步彰显出团队在空间智能与世界模型核心问题上的持续深度探索与原创引领能力。

图1、“无界”模型开源版本 BLM 全球第一(共13个模型)

图2、“无界”模型闭源版本 BWM-Fast 全球第二(共86个模型)
一、WorldArena世界模型榜单,到底是个什么“硬核考场”?
简单来说,WorldArena就是当前全球世界模型领域的“终极试金石”。
以往的世界模型大多停留在“自说自话”的阶段,主要在各自的封闭测试集上进行指标优化与性能评估。而WorldArena则构建了一套更加严苛的全维度评估体系。
其中,Track-1(视频质量赛道)从视觉质量、运动质量、物理遵循性、内容一致性、三维空间准确性以及可控性6大评测维度(包含16项细分指标)进行综合考量,全面检验世界模型的交互能力、物理一致性与未来时空预测能力。
WorldArena吸引了来自国内外科研机构与产业界的多支顶尖团队持续参与,包括Google、NVIDIA、高德、智元机器人、生数科技、极佳视界、流形空间、深度机智、北京人形机器人创新中心等在世界模型领域具有代表性的机构与企业。榜单的每一次更新,不仅反映了模型性能的动态演进,也标志着世界模型技术路线和竞争格局的重塑。
与技术榜单的快速迭代相呼应,资本市场也在持续加码这一赛道。据悉,智元机器人估值已超过200亿元;生数科技与极佳视界均已跻身100亿级独角兽行列;此外,多家参赛团队也相继获得数亿元级别的融资支持,行业热度持续攀升。
二、从视频生成到具身交互,“无界”模型到底强在哪里?
在Track-1(视频质量赛道)上,“无界”模型生成的视频在空间布局、物体外观以及光影连贯性上达到了极高的视觉保真度,有效解决了传统世界模型在长时间推演中常见的漂移和物理失真问题。具体来看,它覆盖了多类典型具身任务:
空间重排任务:保持物体身份与目标布局,维持稳定堆叠接触,并预测自适应夹爪控制。
铰链交互任务:捕捉铰链约束下的开合动力学,在旋转过程中保持物体几何连贯,并稳定延续打开状态。
精细操作任务:动态捕捉细粒度可供性,使接触位置与物体功能区域对齐,并保持状态变化的交互结果。
双臂协同任务:建模双臂协同运动,保持物体一致性,并避免近距离交接中的接触碰撞。
长程放置任务:维持长时序场景一致性,避免遮挡引发的物体漂移,并完成受限空间内的稳定放置。
分布外泛化任务:面对未见过的初始场景和物体外观,模型仍能沿着给定动作序列进行未来推演,保持机器人与物体交互过程的物理一致性。
三、在“算力与数据堆砌”的时代下,作为高校团队如何“以小搏大”?
长期以来,世界模型领域存在一种普遍认知:高保真生成能力往往依赖海量训练数据、超大模型规模以及密集算力投入,行业竞争也因此逐渐演变为“数据与算力”的军备竞赛。但我院空间智能团队选择了一条不同的技术路径。
在数据工程层面,团队并未盲目追求训练数据规模扩张,而是通过训练数据增强与智能增广策略,最大化释放单位数据的训练价值,以更高的数据利用效率提升模型性能。
在模型架构层面,团队基于DiT架构,引入首帧引导、动态记忆机制以及双通路动作控制调制策略,从场景初始化、长时序记忆建模到动作响应控制等多个层面系统增强模型能力,使生成结果在时空连贯性、动作可控性与物理一致性方面表现得更加稳定与自然。
也正因如此,“无界”模型在大幅降低训练成本的同时,依然取得了国际领先的评测成绩,展现出我院空间智能团队在世界模型核心技术方向上的原创突破能力。
四、开源与闭源并进:“无界”系列如何兼顾技术突破与生态共建?
客观来看,当前世界模型行业仍有两大痛点:
学术成果难验证:不少方法停留在自有设定中,缺少公开、全维度的统一权威榜单检验。
顶尖技术难复现:核心模型大多高度闭源,外部团队难以比较、复现和迭代。
因此,“无界”系列选择开源与闭源并进:
开源BLM:释放可复现技术底座,降低科研与开发门槛。
闭源BWM-Fast:持续探索模型性能上限,验证技术路线竞争力。
生态共建:推动高校、企业与开发者共同参与世界模型迭代。
此次“无界”模型登顶WorldArena世界模型榜单,是我院空间智能团队与考拉悠然、上海码极客共同研发的成果,也体现了各方始终秉持打破技术壁垒、推动技术普惠、赋能空间智能生态发展的使命追求。
开源共建:
GitHub 链接:https://github.com/boundless-large-model/boundless-world-model (持续更新中)
Hugging Face 链接:https://huggingface.co/BLM-Lab/Boundless-World-Model