想必听到这个消息的Meta、Google DeepMind一定会缓缓打出一个问号:冲我们来的?
据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。
另一边,在悄然下场世界模型后,马斯克几天前又在上再次重申了去年定下的那个“小目标”——
OpenAI今年收入约100亿美元,视频游戏行业今年收入约2000亿美元。
世界模型是近两年全球AI巨头&实验室们的新战场,Google DeepMind、Meta、NVIDIA、李飞飞等都在做。
今年夏天,xAI至少雇佣了两位来自英伟达的研究人员:Zeeshan Patel和Ethan He。
其中,Zeeshan Patel今年5月硕士毕业于UC伯克利,研究主要面向深度学习、生成模型和物理人工智能。
加入xAI前,他先在苹果AI/ML部门从事基础模型研究,后又加入英伟达研究院从事生成式世界模型研究。
在英伟达工作期间,Zeeshan Patel专注于大规模多模态模型与训练框架的研发
Ethan He,本科毕业于西安交通大学,而后前往CMU攻读计算机视觉的硕士学位,最后满绩毕业。
2019年到2021年期间,Ethan He在FaceBook AI从事研究工程师,工作内容主要包括大规模视频自监督学习、视频基础模型等。
2023年,他加入英伟达,工作内容均与MoE模型、多模态模型和世界模型有关。
若说这两人有什么共同点,那就是两人此前都在英伟达参与了Omniverse平台的核心开发工作。
这个平台是全球最成熟的仿真平台之一,被称作“通往物理世界的数字平行宇宙”。
简单来说,Omniverse是英伟达打造的物理一致性仿真系统,广泛应用于机器人训练、3D 建模、数字孪生、自动驾驶等领域。
它能在虚拟世界中精确地模拟现实物理规律,让AI在不触碰现实的情况下,就能学会如何与世界互动。
Omniverse与世界模型训练/评测天然契合,难怪xAI内部人士透露,马斯克计划在xAI将英伟达在图形与物理模拟领域的积累,应用到自家的世界模型体系中。
“世界模型”这个概念,其实最早可以追溯到强化学习,意思是让AI先在脑海中模拟出一个世界,再去规划行动、预测结果。
在李飞飞看来,世界模型不仅能生成和重建持久存在、可导航的3D环境,还能支持多种应用,实现更大规模的虚拟世界和多元宇宙的构建。
目前,团队正在尝试让AI自动生成自适应、逼线D场景,可以根据玩家行为实时变化的那种。
这与马斯克自己设下的目标完美呼应——到2026年底,推出一款由世界模型驱动的AI生成游戏。
一位用户在上留言称:“AI在游戏开发中的效率很高,能让创造力自由流动,这很有道理。”
与此同时,xAI内部也正在为此组建一支全模态团队(Multimodal Team),专门研究图像、视频、音频的综合理解与生成。
除此之外,还有一个职位在业内引发热议,Video Games Tutor,即电子游戏导师。
看来,马斯克似乎打算让人类专家教模型怎么玩游戏、怎么设计任务、如何构建可交互世界。
马斯克本人在多次公开发言中提到,xAI的使命是“让AI理解宇宙的本质”。而世界模型正是通向理解宇宙的必经之路。
有了世界模型,九游娱乐-官方网站首页AI不再只用来生成内容,而能在内部模拟出一个真实世界的副本。
这意味着它既可以驱动AI游戏,也可以驱动智能体、自动驾驶乃至具身智能机器人。
从这一点上来看,xAI、特斯拉、Neuralink、之间的关系也变得微妙——
xAI研发模型,特斯拉拥有机器人和自动驾驶数据,Neuralink提供脑机接口则是社交与实时反馈的平台。