meta公司近期揭晓了其人工智能领域的最新突破——V-JEPA 2模型,这一创新成果被定位为“世界模型”,旨在赋能AI智能体,让它们更好地理解并适应周遭的物理世界。
V-JEPA 2作为meta去年推出的V-JEPA模型的升级版,其训练素材涵盖了超过百万小时的视频数据。这些丰富的数据资源,旨在模拟并教授AI智能体,如机器人等,在真实物理环境中的运作逻辑,让它们能够理解和预测诸如重力等自然现象对事件演变的影响。
值得注意的是,V-JEPA 2所具备的这种能力,与儿童和动物在成长过程中逐渐形成的常识性认知有着异曲同工之妙。比如,在与人类进行接球游戏时,狗狗能够本能地判断球落地后的反弹轨迹,并准确跑向球可能落点的位置,而非球当前的位置。
meta通过实例进一步阐释了V-JEPA 2的应用场景。设想一个场景,机器人手持盘子和锅铲,走向装有熟鸡蛋的炉灶。借助V-JEPA 2的预测能力,AI能够迅速判断出,接下来最合理的动作是用锅铲将鸡蛋移至盘子中。
在性能表现上,meta声称V-JEPA 2的运行速度相较于Nvidia的Cosmos模型快了30倍。尽管两者都致力于提升AI在物理世界中的智能水平,但可能采用了不同的评估基准来衡量各自模型的效能。
meta首席人工智能科学家Yann LeCun在一则视频中表达了对于V-JEPA 2的乐观态度:“我们坚信,世界模型将引领机器人技术进入一个崭新的时代。这意味着,AI智能体将能够在现实世界中,无需依赖庞大的机器人训练数据集,就能有效地协助人类完成日常家务和各种体力劳动。”
文章采集于互联网