Text2World

Cosmos-Predict1是由Nvidia开发的物理AI世界基础模型，能够从文本或视频提示生成世界状态，并通过预测帧合成连续运动。该项目特别适用于自动驾驶和机器人训练领域，提供高效的图像和视频分词器，支持Text2World和Video2World生成。模型参数范围从40亿到150亿，可根据推理需求选择，生成物理感知视频。

Text2WorldVideo2World机器人训练物理AI世界生成

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。