detr

cheesebird
Detección de objetos

Este modelo es una versión afinada de facebook/detr-resnet-50 en un conjunto de datos desconocido. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.8684.

Como usar

Parámetros de entrenamiento

Los siguientes hiperparámetros se usaron durante el entrenamiento:

  • learning_rate: 0.0001
  • train_batch_size: 4
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 1
  • mixed_precision_training: AMP Nativo

Resultados del entrenamiento

Entrenamiento Pérdida:

| Epoch | Step | Pérdida de Validación |
|-------|------|----------------------|
| 2.2294 | 0.1 | 250 | 1.5375 |
| 1.4499 | 0.2 | 500 | 1.3111 |
| 1.2584 | 0.3 | 750 | 1.1323 |
| 1.1306 | 0.4 | 1000 | 1.0789 |
| 1.1112 | 0.5 | 1250 | 1.0349 |
| 1.0478 | 0.6 | 1500 | 0.9710 |
| 0.9709 | 0.7 | 1750 | 0.9510 |
| 0.96   | 0.8 | 2000 | 0.9061 |
| 0.9417 | 0.9 | 2250 | 0.8761 |
| 0.939  | 1.0 | 2500 | 0.8684 |

Versiones del framework

  • Transformers 4.38.2
  • Pytorch 2.2.1+cu121
  • Datasets 2.19.0
  • Tokenizers 0.15.2

Funcionalidades

Transformers de detección de objetos
Compatible con TensorBoard
Compatibilidad con Safetensors

Casos de uso

Detección de objetos en imágenes