elgeish/cs224n-squad2.0-albert-xxlarge-v1

elgeish
Pregunta y respuesta

El objetivo de este modelo es ahorrar tiempo de GPU a los estudiantes de CS224n al establecer los puntos de referencia para el Proyecto Final predeterminado. El conjunto de entrenamiento utilizado para ajustar este modelo es el mismo que el oficial; sin embargo, la evaluación y la selección del modelo se realizaron con aproximadamente la mitad del conjunto de desarrollo oficial, 6078 ejemplos, elegidos al azar. Los archivos de datos se pueden encontrar en https://github.com/elgeish/squad/tree/master/data — esta es la versión de Invierno 2020. Dado que el conjunto de desarrollo oficial de SQuAD2.0 contiene el conjunto de pruebas del proyecto, los estudiantes deben asegurarse de no utilizar el conjunto de desarrollo oficial de SQuAD2.0 de ninguna manera, incluyendo el uso de modelos ajustados en el SQuAD2.0 oficial, ya que usaron el conjunto de desarrollo oficial de SQuAD2.0 para la selección de modelos.

Como usar

# Código de ejemplo para el uso del modelo
desde transformers import AlbertTokenizer, AlbertForQuestionAnswering
import torch

tokenizer = AlbertTokenizer.from_pretrained('elgeish/cs224n-squad2.0-albert-xxlarge-v1')
model = AlbertForQuestionAnswering.from_pretrained('elgeish/cs224n-squad2.0-albert-xxlarge-v1')

pregunta = '¿Qué es el objetivo del modelo?'
context = 'El objetivo de este modelo es ahorrar tiempo de GPU a los estudiantes de CS224n al establecer los puntos de referencia para el Proyecto Final predeterminado.'

input_ids = tokenizer.encode(pregunta, context)
start_scores, end_scores = model(torch.tensor([input_ids]))

repuesta = tokenizer.convert_tokens_to_string(tokenizer.convert_ids_to_tokens(input_ids[torch.argmax(start_scores): torch.argmax(end_scores)+1]))
print(repuesta)

Funcionalidades

Respuestas a preguntas
Transformadores
PyTorch
Albert
Exbert
Puntos finales de inferencia

Casos de uso

Establecer puntos de referencia para proyectos finales en CS224n
Entrenamiento con conjuntos de datos personalizados para respuesta a preguntas
Evaluación y selección de modelos en un conjunto de desarrollo más pequeño