Modelo base Splinter (con pesos de capa QASS preentrenados)

tau
Pregunta y respuesta

Splinter-base es el modelo preentrenado discutido en el artículo Few-Shot Question Answering by Pretraining Span Selection (en ACL 2021). El modelo es sensible a mayúsculas y minúsculas. Splinter es un modelo preentrenado de forma auto supervisada para preguntas y respuestas de pocos disparos. Fue preentrenado solo en textos en bruto, sin intervención humana para etiquetarlos, usando un proceso automático para generar entradas y etiquetas a partir de esos textos. El objetivo de entrenamiento era la Selección de Span Recurrente (RSS), que emula el proceso de selección de spans involucrado en la extracción de preguntas y respuestas. Además, define la capa de Selección de Span Consciente de Preguntas (QASS), que selecciona spans condicionados a una pregunta específica.

Como usar

El modelo no tiene suficiente actividad para ser desplegado en Inference API (sin servidor) aún. Aumenta su visibilidad social y revisa más tarde, o impleméntalo en Endpoints de Inferencia (dedicados) en su lugar.

Funcionalidades

Preentrenado con el objetivo de Selección de Span Recurrente (RSS)
Define la capa de Selección de Span Consciente de Preguntas (QASS)
Usa datos públicamente disponibles para el preentrenamiento
Sensible a mayúsculas y minúsculas

Casos de uso

Preguntas y respuestas extractivas de pocos disparos