facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs

qubvel-hf
Detección de objetos

Este modelo es una versión afinada de facebook/detr-resnet-50 en el conjunto de datos cppe-5. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.2371, Map: 0.2873, Map 50: 0.5678, Map 75: 0.2501, Map Pequeño: 0.126, Map Mediano: 0.2327, Map Grande: 0.4873, Mar 1: 0.2843, Mar 10: 0.4643, Mar 100: 0.4762, Mar Pequeño: 0.2338, Mar Mediano: 0.4167, Mar Grande: 0.7114, Map Overol: 0.5461, Mar 100 Overol: 0.6932, Map Protector Facial: 0.2167, Mar 100 Protector Facial: 0.4785, Map Guantes: 0.2135, Mar 100 Guantes: 0.4094, Map Gafas: 0.173, Mar 100 Gafas: 0.4092, Map Mascarilla: 0.2871, Mar 100 Mascarilla: 0.3907.

Como usar

El siguiente modelo se puede aplicar para la detección de objetos. Para usar el modelo, puedes cargarlo utilizando la biblioteca Transformers de Hugging Face en código Python de la siguiente manera:

from transformers import DetrForObjectDetection, DetrImageProcessor
import torch
from PIL import Image
import requests

# Cargar modelo y procesador
model = DetrForObjectDetection.from_pretrained('qubvel-hf/facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs')
processor = DetrImageProcessor.from_pretrained('qubvel-hf/facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs')

# Ejemplo de entrada
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)
inputs = processor(images=image, return_tensors='pt')

# Inferencia
outputs = model(**inputs)

# Recuperar predicciones (cajas delimitadoras)
probabilities = outputs.logits.softmax(-1)[0, :, :-1].max(-1)
keep = probabilities.values > 0.9  # Filtrar por confianza

print(outputs[0, keep])

Funcionalidades

Detección de objetos
Transformadores
Safetensors
Finetuning en el conjunto de datos cppe-5
Entrenamiento con aumentaciones

Casos de uso

Detección de objetos en imágenes
Análisis de imágenes de seguridad
Seguimiento de objetos en videovigilancia
Asistencia en conducción autónoma