Modelo base Splinter (con pesos de capa QASS preentrenados)
Splinter-base es el modelo preentrenado discutido en el artículo Few-Shot Question Answering by Pretraining Span Selection (en ACL 2021). El modelo es sensible a mayúsculas y minúsculas. Splinter es un modelo preentrenado de forma auto supervisada para preguntas y respuestas de pocos disparos. Fue preentrenado solo en textos en bruto, sin intervención humana para etiquetarlos, usando un proceso automático para generar entradas y etiquetas a partir de esos textos. El objetivo de entrenamiento era la Selección de Span Recurrente (RSS), que emula el proceso de selección de spans involucrado en la extracción de preguntas y respuestas. Además, define la capa de Selección de Span Consciente de Preguntas (QASS), que selecciona spans condicionados a una pregunta específica.
Como usar
El modelo no tiene suficiente actividad para ser desplegado en Inference API (sin servidor) aún. Aumenta su visibilidad social y revisa más tarde, o impleméntalo en Endpoints de Inferencia (dedicados) en su lugar.
Funcionalidades
- Preentrenado con el objetivo de Selección de Span Recurrente (RSS)
- Define la capa de Selección de Span Consciente de Preguntas (QASS)
- Usa datos públicamente disponibles para el preentrenamiento
- Sensible a mayúsculas y minúsculas
Casos de uso
- Preguntas y respuestas extractivas de pocos disparos