Hunyuan-DiT-Diffusers
Tencent-Hunyuan
Texto a imagen
Hunyuan-DiT: Un potente transformador de difusión multiresolución con comprensión detallada del chino. Este repositorio contiene el modelo de texto a imagen preentrenado en formato de Difusores de 🤗.
Como usar
import torch
from diffusers import HunyuanDiTPipeline
pipe = HunyuanDiTPipeline.from_pretrained("Tencent-Hunyuan/HunyuanDiT-Diffusers", torch_dtype=torch.float16)
pipe.to("cuda")
# También puedes usar un prompt en inglés, ya que HunyuanDiT admite tanto inglés como chino
# prompt = "An astronaut riding a horse"
prompt = "一个宇航员在骑马"
image = pipe(prompt).images[0]
Funcionalidades
- Difusión multiresolución
- Comprensión detallada del chino
- Capacidades de generación avanzadas
- Compatibilidad con inglés y chino
Casos de uso
- Generación de imágenes a partir de texto
- Evaluación comparativa de capacidades de generación de imágenes
- Visualización de elementos chinos
- Entrada de texto largo