microsoft/xdoc-base-squad2.0
microsoft
Pregunta y respuesta
XDoc es un modelo preentrenado unificado que maneja diferentes formatos de documentos en un único modelo. Con solo el 36.7% de los parámetros, XDoc logra un rendimiento comparable o mejor en tareas posteriores, lo cual es rentable para despliegues en el mundo real. XDoc: Pre-entrenamiento Unificado para Comprender Documentos en Formato Cruzado. Jingye Chen, Tengchao Lv, Lei Cui, Cha Zhang, Furu Wei, EMNLP 2022.
Como usar
Para usar este modelo, puedes seguir el siguiente ejemplo en código markdown:
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
tokenizer = AutoTokenizer.from_pretrained('microsoft/xdoc-base-squad2.0')
model = AutoModelForQuestionAnswering.from_pretrained('microsoft/xdoc-base-squad2.0')
question, text = 'Where do I live?', 'My name is Clara and I live in Berkeley.'
inputs = tokenizer(question, text, return_tensors='pt')
outputs = model(**inputs)
Funcionalidades
- Cuestionario
- Transformers
- PyTorch
- roberta
- Endpoints de Inferencia
- arXiv: 2210.02849
- Licencia: MIT
Casos de uso
- Respuestas a preguntas de diferentes documentos y contextos.
- Seguimiento y comprensión de documentos en múltiples formatos.
- Implantación en sistemas de respuesta a preguntas en tiempo real.