Hunyuan-DiT-Diffusers

Tencent-Hunyuan
Texto a imagen

Hunyuan-DiT: Un potente transformador de difusión multiresolución con comprensión detallada del chino. Este repositorio contiene el modelo de texto a imagen preentrenado en formato de Difusores de 🤗.

Como usar

import torch
from diffusers import HunyuanDiTPipeline
pipe = HunyuanDiTPipeline.from_pretrained("Tencent-Hunyuan/HunyuanDiT-Diffusers", torch_dtype=torch.float16)
pipe.to("cuda")

# También puedes usar un prompt en inglés, ya que HunyuanDiT admite tanto inglés como chino
# prompt = "An astronaut riding a horse"
prompt = "一个宇航员在骑马"
image = pipe(prompt).images[0]

Funcionalidades

Difusión multiresolución
Comprensión detallada del chino
Capacidades de generación avanzadas
Compatibilidad con inglés y chino

Casos de uso

Generación de imágenes a partir de texto
Evaluación comparativa de capacidades de generación de imágenes
Visualización de elementos chinos
Entrada de texto largo