detr-resnet-50_fine_tuned_loc-2023
biglam
Detección de objetos
Este modelo es una versión ajustada de facebook/detr-resnet-50 en el conjunto de datos loc_beyond_words. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 0.8784
Como usar
## Hiperparámetros de entrenamiento utilizados:
- learning_rate: 0.0001
- train_batch_size: 8
- eval_batch_size: 8
- seed: 42
- optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 100
## Resultados del entrenamiento:
- Pérdida del entrenamiento
- Época
- Paso
- Pérdida de validación
- 3.731, 0.16, 50, 2.6356
- 2.4875, 0.31, 100, 2.2348
...
- 0.8772, 10.16, 3250, 0.8784
## Versiones del framework:
- Transformers 4.27.4
- Pytorch 2.0.0+cu118
- Datasets 2.11.0
- Tokenizers 0.13.3
Funcionalidades
- Detección de objetos
- Transformers
- PyTorch
- TensorBoard
Casos de uso
- Detección de objetos en imágenes de periódicos
- Investigación y análisis de imágenes históricas