nvidia/Cosmos-1.0-Diffusion-7B-Text2World

nvidia
Texto a video

Modelo de NVIDIA Cosmos de 7B parámetros para generación de video a partir de texto. Forma parte de la suite Cosmos-1.0-Diffusion de modelos fundacionales del mundo físico y está orientado a tareas text-to-video, usando bibliotecas como Cosmos, Diffusers y NeMo. El repositorio está gated y requiere aceptar la NVIDIA Open Model License para acceder al contenido del modelo.

Como usar

Instalación y uso con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("nvidia/Cosmos-1.0-Diffusion-7B-Text2World", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Para Cosmos, la página no incluye todavía snippets de código. Para NeMo, el tag no corresponde a un dominio válido de NeMo según la página.

Funcionalidades

Generación de video desde prompts de texto mediante un modelo de difusión Text2World.
Modelo multimodal de la familia NVIDIA Cosmos, asociado al paper arXiv 2501.03575 sobre World Foundation Models para Physical AI.
Distribuido en Hugging Face con soporte indicado para Cosmos, Diffusers, Safetensors y NeMo.
Licencia NVIDIA Open Model License: permite uso comercial, creación y distribución de modelos derivados, y no reclama propiedad sobre las salidas generadas.
Acceso gated automático: requiere iniciar sesión y aceptar compartir información de contacto y los términos de NVIDIA.
Etiquetado regional como Estados Unidos y publicado por NVIDIA.

Casos de uso

Crear videos o escenas visuales a partir de descripciones textuales.
Prototipar flujos de simulación visual para Physical AI y modelos del mundo.
Generar datos visuales sintéticos o clips conceptuales para investigación y experimentación.
Construir o ajustar modelos derivados basados en NVIDIA Cosmos, respetando las condiciones de redistribución y atribución.