HiDream-I1-Full

HiDream-ai
Texto a imagen

Modelo fundacional abierto de generación de imágenes de 17B parámetros, orientado a texto a imagen. Destaca por su alta calidad visual en segundos, fuerte seguimiento de prompts y resultados competitivos en benchmarks como GenEval, DPG-Bench y HPS v2.1.

Como usar

Instala las dependencias y Flash Attention, clona el repositorio oficial y ejecuta el script de inferencia según la variante del modelo.

pip install -r requirements.txt
git clone https://github.com/HiDream-ai/HiDream-I1
# Para inferencia con el modelo completo
python ./inference.py --model_type full

# Para inferencia con el modelo destilado dev
python ./inference.py --model_type dev

# Para inferencia con el modelo destilado fast
python ./inference.py --model_type fast

También ofrece una demo interactiva:

python gradio_demo.py

Nota: el script descarga automáticamente archivos de meta-llama/Meta-Llama-3.1-8B-Instruct. Si hay problemas de red, conviene precargarlos en caché.

Funcionalidades

Generación de imágenes texto a imagen con 17B parámetros
Alta calidad visual en estilos fotorrealistas, caricaturescos y artísticos
Seguimiento de instrucciones destacado según GenEval y DPG-Bench
Licencia MIT para el modelo Transformer principal
Uso comercial permitido para el contenido generado, sujeto al acuerdo de licencia
Demo interactiva con Gradio
Versiones de inferencia full, dev y fast

Casos de uso

Creación de imágenes fotorrealistas a partir de prompts detallados
Generación de ilustraciones y arte conceptual
Producción de imágenes estilizadas o tipo cartoon
Prototipado visual rápido para diseño y creatividad comercial
Experimentación e investigación en generación de imágenes abierta