AuraFlow v0.3

fal
Texto a imagen

AuraFlow v0.3 es el modelo de generación de imágenes a partir de texto basado en flujo completamente de código abierto. El modelo se entrenó con más recursos computacionales en comparación con la versión anterior, AuraFlow-v0.2. En comparación con AuraFlow-v0.2, el modelo está ajustado con más conjuntos de datos estéticos y ahora soporta varias proporciones de aspecto, (ahora ancho y alto hasta 1536 píxeles). Este modelo logra resultados de última generación en GenEval. Lea nuestra publicación en el blog para más detalles técnicos. También puede ver la comparación con otros modelos en esta página de la galería. El modelo actualmente está en versión beta. Estamos trabajando en mejorarlo y el feedback de la comunidad es importante. Únase al Discord de fal para darnos su opinión y estar en contacto con el desarrollo del modelo. Créditos: Un gran agradecimiento a @cloneofsimo y @isidentical por dar vida a este proyecto. Es increíble lo que dos ingenieros expertos pueden lograr en tan poco tiempo. También extendemos nuestra gratitud a los increíbles investigadores cuyo trabajo previo sentó las bases para nuestros esfuerzos.

Como usar

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git

from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow-v0.3",
torch_dtype=torch.float16,
variant="fp16",
).to("cuda")

image = pipeline(
prompt="rempage of the iguana character riding F1, fast and furious, cinematic movie poster",
width=1536,
height=768,
num_inference_steps=50, 
generator=torch.Generator().manual_seed(1),
guidance_scale=3.5,
).images[0]

image.save("output.png")

Funcionalidades

Modelo de generación de imágenes a partir de texto basado en flujo completamente de código abierto
Entrenado con más recursos computacionales comparado con la versión anterior
Ajustado con más conjuntos de datos estéticos
Soporta varias proporciones de aspecto, hasta 1536 píxeles
Logra resultados de última generación en GenEval

Casos de uso

Generación de imágenes estéticas a partir de descripciones textuales
Creación de pósteres de películas cinematográficos
Adaptación de proporciones de aspecto variadas para imágenes