facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs
Este modelo es una versión afinada de facebook/detr-resnet-50 en el conjunto de datos cppe-5. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.2371, Map: 0.2873, Map 50: 0.5678, Map 75: 0.2501, Map Pequeño: 0.126, Map Mediano: 0.2327, Map Grande: 0.4873, Mar 1: 0.2843, Mar 10: 0.4643, Mar 100: 0.4762, Mar Pequeño: 0.2338, Mar Mediano: 0.4167, Mar Grande: 0.7114, Map Overol: 0.5461, Mar 100 Overol: 0.6932, Map Protector Facial: 0.2167, Mar 100 Protector Facial: 0.4785, Map Guantes: 0.2135, Mar 100 Guantes: 0.4094, Map Gafas: 0.173, Mar 100 Gafas: 0.4092, Map Mascarilla: 0.2871, Mar 100 Mascarilla: 0.3907.
Como usar
El siguiente modelo se puede aplicar para la detección de objetos. Para usar el modelo, puedes cargarlo utilizando la biblioteca Transformers de Hugging Face en código Python de la siguiente manera:
from transformers import DetrForObjectDetection, DetrImageProcessor
import torch
from PIL import Image
import requests
# Cargar modelo y procesador
model = DetrForObjectDetection.from_pretrained('qubvel-hf/facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs')
processor = DetrImageProcessor.from_pretrained('qubvel-hf/facebook-detr-resnet-50-finetuned-10k-cppe5-with-augs')
# Ejemplo de entrada
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)
inputs = processor(images=image, return_tensors='pt')
# Inferencia
outputs = model(**inputs)
# Recuperar predicciones (cajas delimitadoras)
probabilities = outputs.logits.softmax(-1)[0, :, :-1].max(-1)
keep = probabilities.values > 0.9 # Filtrar por confianza
print(outputs[0, keep])
Funcionalidades
- Detección de objetos
- Transformadores
- Safetensors
- Finetuning en el conjunto de datos cppe-5
- Entrenamiento con aumentaciones
Casos de uso
- Detección de objetos en imágenes
- Análisis de imágenes de seguridad
- Seguimiento de objetos en videovigilancia
- Asistencia en conducción autónoma