NVIDIA 最近推出了 Cosmos 3,这是其迄今为止性能最强且用途最广的物理人工智能模型。该模型采用了创新的混合变压器架构,将语言、视频、音频和动作的理解与生成能力整合进单一的全能模型中。为了满足不同需求,官方提供了追求高精度的 Super 模型以及适用于边缘设备的 Nano 模型。Cosmos 3 在多项物理理解与机器人策略基准测试中均名列前茅,展现出卓越的图像转视频生成能力。为了推动行业发展,NVIDIA 已将该模型的权重、训练脚本及数据集完全开源,开发者可通过 Hugging Face 和 GitHub 获取。这一举措旨在为全球开发者提供高质量的基础模型,共同加速物理 AI 领域的创新与应用。