GonzaloMG/marigold-e2e-ft-normals
GonzaloMG
Texto a imagen
Modelo Diffusers basado en Stable Diffusion para estimación monocular de normales de superficie en imágenes reales. Está orientado a predicción de normales "in-the-wild", con capacidad zero-shot y procesamiento de un solo paso; la tarjeta README existe pero no contiene descripción adicional.
Como usar
Instalación y ejemplo con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("GonzaloMG/marigold-e2e-ft-normals", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Funcionalidades
- Estimación monocular de normales de superficie a partir de una imagen o entrada visual.
- Ajuste end-to-end para predicción de normales con arquitectura de difusión.
- Compatible con Diffusers y pesos en formato Safetensors.
- Licencia Apache 2.0.
- Modelo etiquetado para uso zero-shot, single-step e imágenes reales.
Casos de uso
- Estimar mapas de normales de superficie desde imágenes monoculares.
- Preparar señales geométricas para reconstrucción 3D, renderizado o pipelines de visión por computador.
- Analizar geometría aproximada de escenas reales sin entrenamiento específico por dominio.
- Generar normales como paso previo para tareas de edición, composición o relighting.