roberta-large-bne-sqac

PlanTL-GOB-ES

Pregunta y respuesta

El roberta-large-bne-sqac es un modelo de Preguntas y Respuestas (QA) para el idioma español afinado a partir del modelo roberta-large-bne, un modelo grande de RoBERTa pre-entrenado utilizando el corpus español más grande conocido hasta la fecha, con un total de 570GB de texto limpio y deduplicado, procesado para este trabajo, compilado a partir de las exploraciones web realizadas por la Biblioteca Nacional de España (Biblioteca Nacional de España) de 2009 a 2019.

Como usar

from transformers import pipeline
nlp = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")
text = "¿Dónde vivo?"
context = "Me llamo Wolfgang y vivo en Berlin"
qa_results = nlp(text, context)
print(qa_results)

Funcionalidades

Modelo de Preguntas y Respuestas para el idioma español
Afinado a partir del modelo roberta-large-bne
Entrenado con el corpus SQAC
Evaluación en el conjunto de prueba de SQAC con una métrica F1 de 82.02

Casos de uso

Extracción de respuestas en español
Aplicaciones de Preguntas y Respuestas en español
Análisis de textos en español para identificar información clave