microsoft/xdoc-base-squad2.0

microsoft

Pregunta y respuesta

XDoc es un modelo preentrenado unificado que maneja diferentes formatos de documentos en un único modelo. Con solo el 36.7% de los parámetros, XDoc logra un rendimiento comparable o mejor en tareas posteriores, lo cual es rentable para despliegues en el mundo real. XDoc: Pre-entrenamiento Unificado para Comprender Documentos en Formato Cruzado. Jingye Chen, Tengchao Lv, Lei Cui, Cha Zhang, Furu Wei, EMNLP 2022.

Como usar

Para usar este modelo, puedes seguir el siguiente ejemplo en código markdown:
from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained('microsoft/xdoc-base-squad2.0')
model = AutoModelForQuestionAnswering.from_pretrained('microsoft/xdoc-base-squad2.0')

question, text = 'Where do I live?', 'My name is Clara and I live in Berkeley.'
inputs = tokenizer(question, text, return_tensors='pt')
outputs = model(**inputs)

Funcionalidades

Cuestionario
Transformers
PyTorch
roberta
Endpoints de Inferencia
arXiv: 2210.02849
Licencia: MIT

Casos de uso

Respuestas a preguntas de diferentes documentos y contextos.
Seguimiento y comprensión de documentos en múltiples formatos.
Implantación en sistemas de respuesta a preguntas en tiempo real.