AuraFlow v0.2

fal

Texto a imagen

AuraFlow v0.2 es el modelo de generación de texto a imagen basado en flujo más grande y completamente de código abierto. El modelo fue entrenado con más computación en comparación con la versión anterior, AuraFlow-v0.1. Este modelo logra resultados de vanguardia en GenEval. Lee nuestra publicación en el blog para más detalles técnicos. Actualmente, el modelo está en versión beta. Estamos trabajando en mejorarlo y la retroalimentación de la comunidad es importante. Un enorme agradecimiento a @cloneofsimo y @isidentical por hacer realidad este proyecto.

Como usar

$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git

from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow-v0.2",
torch_dtype=torch.float16,
variant="fp16",
).to("cuda")

image = pipeline(
prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
height=1024,
width=1024,
num_inference_steps=50, 
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]

image.save("output.png")

Funcionalidades

Mayor modelo de generación de texto a imagen basado en flujo de código abierto
Entrenado con más computación en comparación con la versión anterior
Resultados de vanguardia en GenEval

Casos de uso

Generación de imágenes hiperrealistas de alta resolución a partir de texto
Aplicaciones artísticas y creativas
Creación de imágenes detalladas con iluminación dramática y características expresivas