GonzaloMG/marigold-e2e-ft-normals

GonzaloMG
Texto a imagen

Modelo Diffusers basado en Stable Diffusion para estimación monocular de normales de superficie en imágenes reales. Está orientado a predicción de normales "in-the-wild", con capacidad zero-shot y procesamiento de un solo paso; la tarjeta README existe pero no contiene descripción adicional.

Como usar

Instalación y ejemplo con Diffusers:

pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("GonzaloMG/marigold-e2e-ft-normals", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Estimación monocular de normales de superficie a partir de una imagen o entrada visual.
Ajuste end-to-end para predicción de normales con arquitectura de difusión.
Compatible con Diffusers y pesos en formato Safetensors.
Licencia Apache 2.0.
Modelo etiquetado para uso zero-shot, single-step e imágenes reales.

Casos de uso

Estimar mapas de normales de superficie desde imágenes monoculares.
Preparar señales geométricas para reconstrucción 3D, renderizado o pipelines de visión por computador.
Analizar geometría aproximada de escenas reales sin entrenamiento específico por dominio.
Generar normales como paso previo para tareas de edición, composición o relighting.