AuraFlow

fal

Texto a imagen

AuraFlow v0.1 es el modelo de generación de texto a imagen basado en flujo más grande completamente de código abierto. Este modelo logra resultados de vanguardia en GenEval. Actualmente, el modelo está en beta. Estamos trabajando para mejorarlo y la retroalimentación de la comunidad es importante.

Como usar

Uso
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git

from diffusers import AuraFlowPipeline
import torch

pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow",
torch_dtype=torch.float16
).to("cuda")

image = pipeline(
prompt="primer plano de un majestuoso iguana con escamas azul-verde vibrantes, ojos ámbar penetrantes y una cresta espinosa naranja. Texturas y detalles intrincados visibles en la piel escamosa. Envuelto en una capucha oscura, dando una apariencia real. Iluminación dramática contra un fondo negro. Imagen hiperrealista y de alta resolución que muestra las características expresivas y la coloración del reptil.",
height=1024,
width=1024,
num_inference_steps=50,
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]

Funcionalidades

Generación de texto a imagen basada en flujo
Resultados de vanguardia en GenEval
Modelo de código abierto
En desarrollo y actualmente en fase beta

Casos de uso

Generación de imágenes hiperrealistas y de alta resolución a partir de descripciones textuales
Creación de retratos detallados de animales y otros sujetos
Investigación y desarrollo en generación de imágenes basada en IA