ProGamerGov/qwen-360-diffusion

ProGamerGov
Texto a imagen

Qwen 360 Diffusion es una LoRA de rango 128 basada en Qwen Image, un modelo MMDiT multimodal de 20B parámetros, entrenada para generar imágenes panorámicas de 360 grados en proyección equirectangular a partir de descripciones de texto. Está orientada a panoramas 2:1, escenas VR, skyboxes, entornos virtuales y también imágenes equirectangulares útiles fuera de VR, como fotografía, arte, arquitectura o retrato.

Como usar

Para activar la generación panorámica, el prompt debe incluir frases como equirectangular, 360 image, 360 panorama o 360 degree panorama with equirectangular projection.

Ejemplo con Diffusers:

pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "ProGamerGov/qwen-360-diffusion",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Ajustes recomendados: usar relación 2:1, preferiblemente 2048x1024; especificar el medio o estilo deseado; recordar que los bordes izquierdo y derecho se conectan; y, para sujetos humanos de cuerpo completo, describir cabeza, rostro y calzado para reducir deformaciones o partes incompletas.

Funcionalidades

Generación de imágenes 360 grados en proyección equirectangular desde texto.
Entrenada con unas 35k imágenes equirectangulares 360 revisadas manualmente y aumentadas mediante rotaciones horizontales.
Funciona mejor con resolución 2048x1024 y otras relaciones 2:1, aunque resoluciones menores pueden empeorar los horizontes.
Puede producir escenas realistas si se le pide correctamente, además de estilos como fotografía, óleo, ilustración o arte digital.
Incluye compatibilidad práctica con Diffusers, ComfyUI y visores HTML 360 externos.
Licencia MIT.

Casos de uso

Crear panoramas 360 para visores web, VR y experiencias inmersivas.
Generar skyboxes y fondos para entornos 3D o mundos virtuales.
Producir imágenes equirectangulares para fotografía, arte, arquitectura, retratos o ilustraciones no necesariamente VR.
Crear material para flujos de texto a imagen, imagen a vídeo y vídeo a mundo 3D.
Generar escenas para VR terapéutica, fondos envolventes o visualización espacial.