madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1
madlag
Pregunta y respuesta
Modelo BERT-base uncased ajustado en SQuAD v1 con sparsidad en bloques. Este modelo contiene el 47.0% de los pesos originales en general y fue ajustado a partir del checkpoint de HuggingFace BERT base uncased en SQuAD1.1, y destilado del modelo equivalente csarron/bert-base-uncased-squad-v1. Se utilizó una versión modificada del método de poda de movimiento de Victor Sanh. El modelo es insensible a mayúsculas y minúsculas.
Como usar
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1",
tokenizer="madlag/bert-base-uncased-squad1.1-block-sparse-0.32-v1")
predictions = qa_pipeline({
'context': "Frédéric François Chopin, born Fryderyk Franciszek Chopin (1 March 1810 – 17 October 1849), was a Polish composer and virtuoso pianist of the Romantic era who wrote primarily for solo piano.",
'question': "Who is Frederic Chopin?",
})
print(predictions)
Funcionalidades
- El modelo es insensible a mayúsculas y minúsculas.
- Las capas lineares contienen el 31.7% de los pesos originales.
- Corre 1.12 veces más rápido que redes densas en evaluación con impacto en la precisión.
- 80 cabezas de atención fueron removidas de un total de 144 (55.6%).
Casos de uso
- Responder preguntas basadas en contextos proveídos.
- Implementaciones de inferencia más rápidas con impactos moderados en precisión.