madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1

madlag

Pregunta y respuesta

Modelo BERT-base uncased ajustado en SQuAD v1 con sparsidad en bloques. Este modelo contiene el 47.0% de los pesos originales en general y fue ajustado a partir del checkpoint de HuggingFace BERT base uncased en SQuAD1.1, y destilado del modelo equivalente csarron/bert-base-uncased-squad-v1. Se utilizó una versión modificada del método de poda de movimiento de Victor Sanh. El modelo es insensible a mayúsculas y minúsculas.

Como usar

from transformers import pipeline

qa_pipeline = pipeline(
"question-answering",
model="madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1",
tokenizer="madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1")

predictions = qa_pipeline({
'context': "Frédéric François Chopin, born Fryderyk Franciszek Chopin (1 March 1810 – 17 October 1849), was a Polish composer and virtuoso pianist of the Romantic era who wrote primarily for solo piano.",
'question': "Who is Frederic Chopin?",
})

print(predictions)

Funcionalidades

El modelo es insensible a mayúsculas y minúsculas.
Las capas lineares contienen el 31.7% de los pesos originales.
Corre 1.12 veces más rápido que redes densas en evaluación con impacto en la precisión.
80 cabezas de atención fueron removidas de un total de 144 (55.6%).

Casos de uso

Responder preguntas basadas en contextos proveídos.
Implementaciones de inferencia más rápidas con impactos moderados en precisión.