deberta_squadnewsqa

sophiebottani
Pregunta y respuesta

Este modelo es una versión afinada de microsoft/deberta-v3-base en los conjuntos de datos Squad_v2 y NewsQA. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.9648.

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 1

Funcionalidades

Transformers
Cuestionario
PyTorch
squad_v2
newsqa
deberta-v2
Generado a partir de Trainer
Endpoints de Inferencia

Casos de uso