AuraFlow v0.3
AuraFlow v0.3 es el modelo de generación de imágenes a partir de texto basado en flujo completamente de código abierto. El modelo se entrenó con más recursos computacionales en comparación con la versión anterior, AuraFlow-v0.2. En comparación con AuraFlow-v0.2, el modelo está ajustado con más conjuntos de datos estéticos y ahora soporta varias proporciones de aspecto, (ahora ancho y alto hasta 1536 píxeles). Este modelo logra resultados de última generación en GenEval. Lea nuestra publicación en el blog para más detalles técnicos. También puede ver la comparación con otros modelos en esta página de la galería. El modelo actualmente está en versión beta. Estamos trabajando en mejorarlo y el feedback de la comunidad es importante. Únase al Discord de fal para darnos su opinión y estar en contacto con el desarrollo del modelo. Créditos: Un gran agradecimiento a @cloneofsimo y @isidentical por dar vida a este proyecto. Es increíble lo que dos ingenieros expertos pueden lograr en tan poco tiempo. También extendemos nuestra gratitud a los increíbles investigadores cuyo trabajo previo sentó las bases para nuestros esfuerzos.
Como usar
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch
pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow-v0.3",
torch_dtype=torch.float16,
variant="fp16",
).to("cuda")
image = pipeline(
prompt="rempage of the iguana character riding F1, fast and furious, cinematic movie poster",
width=1536,
height=768,
num_inference_steps=50,
generator=torch.Generator().manual_seed(1),
guidance_scale=3.5,
).images[0]
image.save("output.png")
Funcionalidades
- Modelo de generación de imágenes a partir de texto basado en flujo completamente de código abierto
- Entrenado con más recursos computacionales comparado con la versión anterior
- Ajustado con más conjuntos de datos estéticos
- Soporta varias proporciones de aspecto, hasta 1536 píxeles
- Logra resultados de última generación en GenEval
Casos de uso
- Generación de imágenes estéticas a partir de descripciones textuales
- Creación de pósteres de películas cinematográficos
- Adaptación de proporciones de aspecto variadas para imágenes