AuraFlow
fal
Texto a imagen
AuraFlow v0.1 es el modelo de generación de texto a imagen basado en flujo más grande completamente de código abierto. Este modelo logra resultados de vanguardia en GenEval. Actualmente, el modelo está en beta. Estamos trabajando para mejorarlo y la retroalimentación de la comunidad es importante.
Como usar
Uso
$ pip install transformers accelerate protobuf sentencepiece
$ pip install git+https://github.com/huggingface/diffusers.git
from diffusers import AuraFlowPipeline
import torch
pipeline = AuraFlowPipeline.from_pretrained(
"fal/AuraFlow",
torch_dtype=torch.float16
).to("cuda")
image = pipeline(
prompt="primer plano de un majestuoso iguana con escamas azul-verde vibrantes, ojos ámbar penetrantes y una cresta espinosa naranja. Texturas y detalles intrincados visibles en la piel escamosa. Envuelto en una capucha oscura, dando una apariencia real. Iluminación dramática contra un fondo negro. Imagen hiperrealista y de alta resolución que muestra las características expresivas y la coloración del reptil.",
height=1024,
width=1024,
num_inference_steps=50,
generator=torch.Generator().manual_seed(666),
guidance_scale=3.5,
).images[0]
Funcionalidades
- Generación de texto a imagen basada en flujo
- Resultados de vanguardia en GenEval
- Modelo de código abierto
- En desarrollo y actualmente en fase beta
Casos de uso
- Generación de imágenes hiperrealistas y de alta resolución a partir de descripciones textuales
- Creación de retratos detallados de animales y otros sujetos
- Investigación y desarrollo en generación de imágenes basada en IA