HiDream-I1-Full
HiDream-ai
Texto a imagen
Modelo fundacional abierto de generación de imágenes de 17B parámetros, orientado a texto a imagen. Destaca por su alta calidad visual en segundos, fuerte seguimiento de prompts y resultados competitivos en benchmarks como GenEval, DPG-Bench y HPS v2.1.
Como usar
Instala las dependencias y Flash Attention, clona el repositorio oficial y ejecuta el script de inferencia según la variante del modelo.
pip install -r requirements.txt
git clone https://github.com/HiDream-ai/HiDream-I1
# Para inferencia con el modelo completo
python ./inference.py --model_type full
# Para inferencia con el modelo destilado dev
python ./inference.py --model_type dev
# Para inferencia con el modelo destilado fast
python ./inference.py --model_type fast
También ofrece una demo interactiva:
python gradio_demo.py
Nota: el script descarga automáticamente archivos de meta-llama/Meta-Llama-3.1-8B-Instruct. Si hay problemas de red, conviene precargarlos en caché.
Funcionalidades
- Generación de imágenes texto a imagen con 17B parámetros
- Alta calidad visual en estilos fotorrealistas, caricaturescos y artísticos
- Seguimiento de instrucciones destacado según GenEval y DPG-Bench
- Licencia MIT para el modelo Transformer principal
- Uso comercial permitido para el contenido generado, sujeto al acuerdo de licencia
- Demo interactiva con Gradio
- Versiones de inferencia full, dev y fast
Casos de uso
- Creación de imágenes fotorrealistas a partir de prompts detallados
- Generación de ilustraciones y arte conceptual
- Producción de imágenes estilizadas o tipo cartoon
- Prototipado visual rápido para diseño y creatividad comercial
- Experimentación e investigación en generación de imágenes abierta