longformer-base-4096-ajustado-squad2-longitud-1024-128ventana

learning_rate: 2e-05
train_batch_size: 4
eval_batch_size: 4
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 1

ChuVN

Pregunta y respuesta

Este modelo es una versión ajustada de allenai/longformer-base-4096 en el conjunto de datos squad_v2. Logra los siguientes resultados en el conjunto de evaluación: Loss: 0.9057

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 4
eval_batch_size: 4
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 1

Resultados del Entrenamiento

Training Loss: 0.8641
Epoch: 1.0
Step: 32580
Validation Loss: 0.9057

Versiones del Marco de Trabajo

Transformers 4.20.1
Pytorch 1.12.0+cu113
Datasets 2.3.2
Tokenizers 0.12.1

Funcionalidades

Transformers
Pytorch
TensorBoard
Longformer
Question Answering
Generated from Trainer
Inference Endpoints
Dataset: squad_v2
Region: US

Casos de uso

Respuestas a preguntas