elgeish/cs224n-squad2.0-albert-xxlarge-v1
El objetivo de este modelo es ahorrar tiempo de GPU a los estudiantes de CS224n al establecer los puntos de referencia para el Proyecto Final predeterminado. El conjunto de entrenamiento utilizado para ajustar este modelo es el mismo que el oficial; sin embargo, la evaluación y la selección del modelo se realizaron con aproximadamente la mitad del conjunto de desarrollo oficial, 6078 ejemplos, elegidos al azar. Los archivos de datos se pueden encontrar en https://github.com/elgeish/squad/tree/master/data — esta es la versión de Invierno 2020. Dado que el conjunto de desarrollo oficial de SQuAD2.0 contiene el conjunto de pruebas del proyecto, los estudiantes deben asegurarse de no utilizar el conjunto de desarrollo oficial de SQuAD2.0 de ninguna manera, incluyendo el uso de modelos ajustados en el SQuAD2.0 oficial, ya que usaron el conjunto de desarrollo oficial de SQuAD2.0 para la selección de modelos.
Como usar
# Código de ejemplo para el uso del modelo
desde transformers import AlbertTokenizer, AlbertForQuestionAnswering
import torch
tokenizer = AlbertTokenizer.from_pretrained('elgeish/cs224n-squad2.0-albert-xxlarge-v1')
model = AlbertForQuestionAnswering.from_pretrained('elgeish/cs224n-squad2.0-albert-xxlarge-v1')
pregunta = '¿Qué es el objetivo del modelo?'
context = 'El objetivo de este modelo es ahorrar tiempo de GPU a los estudiantes de CS224n al establecer los puntos de referencia para el Proyecto Final predeterminado.'
input_ids = tokenizer.encode(pregunta, context)
start_scores, end_scores = model(torch.tensor([input_ids]))
repuesta = tokenizer.convert_tokens_to_string(tokenizer.convert_ids_to_tokens(input_ids[torch.argmax(start_scores): torch.argmax(end_scores)+1]))
print(repuesta)
Funcionalidades
- Respuestas a preguntas
- Transformadores
- PyTorch
- Albert
- Exbert
- Puntos finales de inferencia
Casos de uso
- Establecer puntos de referencia para proyectos finales en CS224n
- Entrenamiento con conjuntos de datos personalizados para respuesta a preguntas
- Evaluación y selección de modelos en un conjunto de desarrollo más pequeño