layoutlmv3-finetuned-funsd

Narsil
Detección de objetos

Este modelo es una versión ajustada de microsoft/layoutlmv3-base en el dataset nielsr/funsd-layoutlmv3. Logra los siguientes resultados en el conjunto de evaluación: Pérdida: 1.1164, Precisión: 0.9026, Recall: 0.913, F1: 0.9078, Exactitud: 0.8330. El script para el entrenamiento se puede encontrar aquí: https://github.com/huggingface/transformers/tree/main/examples/research_projects/layoutlmv3

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 1e-05
train_batch_size: 16
eval_batch_size: 16
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
training_steps: 1000

Los resultados de entrenamiento incluyen pérdida de validación, precisión, recall, F1 y exactitud a diferentes pasos durante el proceso de entrenamiento.

Funcionalidades

Compatible con AutoTrain
Compatible con puntos finales de inferencia
Compatible con PyTorch
Compatible con TensorBoard
Transformers

Casos de uso

Clasificación de tokens
Detección de objetos