cstorm125/wangchan-deberta_v1-base-wiki-20210520-news-spm-finetune-qa

cstorm125
Pregunta y respuesta

Afinamiento de airesearch/wangchan-deberta_v1-base-wiki-20210520-news-spm con el conjunto de entrenamiento de iapp_wiki_qa_squad, thaiqa_squad y nsc_qa (se eliminaron ejemplos que tienen una similitud de coseno con los ejemplos de validación y prueba superior a 0.8; los contextos de los dos últimos fueron recortados para tener alrededor de 300 palabras de newmm). Los benchmarks se compartieron en wandb utilizando los conjuntos de validación y prueba de iapp_wiki_qa_squad. Entrenado con thai2transformers.

Como usar

Se ejecuta con:

export MODEL_NAME=wangchan-deberta_v1-base-wiki-20210520-news-spm
CUDA_LAUNCH_BLOCKING=1 python train_question_answering_lm_finetuning.py \
--model_name $MODEL_NAME \
--dataset_name chimera_qa \
--revision mlm@ckp-41100 \
--output_dir $MODEL_NAME-finetune-chimera_qa-model \
--log_dir $MODEL_NAME-finetune-chimera_qa-log \
--model_max_length 400 \
--pad_on_right \
--fp16 \
--use_auth_token

Funcionalidades

Preguntas y respuestas
Transformers
PyTorch
DeBERTa
Compatibilidad con Endpoints de Inferencia

Casos de uso

Respuestas a preguntas en páginas wiki
Asistentes virtuales
Sistemas de preguntas y respuestas para entornos educativos
Automatización de respuestas en servicio al cliente