AuraFlow v0.2
fal
Texto a imagen
AuraFlow v0.2 es el modelo de generación de texto a imagen basado en flujo más grande y completamente de código abierto. El modelo fue entrenado con más computación en comparación con la versión anterior, AuraFlow-v0.1. Este modelo logra resultados de vanguardia en GenEval. Lee nuestra publicación en el blog para más detalles técnicos. Actualmente, el modelo está en versión beta. Estamos trabajando en mejorarlo y la retroalimentación de la comunidad es importante. Un enorme agradecimiento a @cloneofsimo y @isidentical por hacer realidad este proyecto.
Como usar
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch
pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow-v0.2",
torch_dtype=torch.float16,
variant="fp16",
).to("cuda")
image = pipeline(
prompt="close-up portrait of a majestic iguana with vibrant blue-green scales, piercing amber eyes, and orange spiky crest. Intricate textures and details visible on scaly skin. Wrapped in dark hood, giving regal appearance. Dramatic lighting against black background. Hyper-realistic, high-resolution image showcasing the reptile's expressive features and coloration.",
height=1024,
width=1024,
num_inference_steps=50,
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]
image.save("output.png")
Funcionalidades
- Mayor modelo de generación de texto a imagen basado en flujo de código abierto
- Entrenado con más computación en comparación con la versión anterior
- Resultados de vanguardia en GenEval
Casos de uso
- Generación de imágenes hiperrealistas de alta resolución a partir de texto
- Aplicaciones artísticas y creativas
- Creación de imágenes detalladas con iluminación dramática y características expresivas