detección de objetos de moda

yainage90
Detección de objetos

Este modelo es una versión ajustada de microsoft/conditional-detr-resnet-50. Puede encontrar detalles del modelo en este repositorio de github -> fashion-visual-search. Este modelo fue entrenado usando una combinación de dos conjuntos de datos: modanet y fashionpedia. En la época 96 de un total de 100 épocas, se logró la mejor puntuación con un mAP de 0.7542. Por lo tanto, se cree que hay un pequeño margen para mejorar el rendimiento.

Como usar

from PIL import Image
import torch
from transformers import AutoImageProcessor, AutoModelForObjectDetection

ckpt = 'yainage90/fashion-object-detection'
image_processor = AutoImageProcessor.from_pretrained(ckpt)
model = AutoModelForObjectDetection.from_pretrained(ckpt).to(device)

image = Image.open(' ').convert('RGB')

with torch.no_grad():
    inputs = image_processor(images=[image], return_tensors="pt")
    outputs = model(**inputs.to(device))
    target_sizes = torch.tensor([[image.size[1], image.size[0]]])
    results = image_processor.post_process_object_detection(outputs, threshold=0.4, target_sizes=target_sizes)[0]

items = []
for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
    score = score.item()
    label = label.item()
    box = [i.item() for i in box]
    print(f"{model.config.id2label[label]}: {round(score, 3)} at {box}")
    items.append((score, label, box))

Funcionalidades

Basado en Transformers
Utiliza pesas de Safetensors
Soporte de detección de objetos
Entrenado con los conjuntos de datos modanet y fashionpedia
Etiquetas del modelo: ['bolsa', 'inferior', 'vestido', 'sombrero', 'zapatos', 'exterior', 'superior']

Casos de uso

Detección de objetos en imágenes de moda
Etiqueta y clasificación de prendas y accesorios en imágenes
Asistencia en búsquedas visuales de moda