deberta_squadnewsqa

sophiebottani

Pregunta y respuesta

Este modelo es una versión afinada de microsoft/deberta-v3-base en los conjuntos de datos Squad_v2 y NewsQA. Alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.9648.

Como usar

Los siguientes hiperparámetros se utilizaron durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Adam con betas=(0.9,0.999) y epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 1

Funcionalidades

Transformers
Cuestionario
PyTorch
squad_v2
newsqa
deberta-v2
Generado a partir de Trainer
Endpoints de Inferencia

Como usar

Funcionalidades

Casos de uso