microsoft/markuplm-large-finetuned-websrc

microsoft
Pregunta y respuesta

MarkupLM es un método simple pero efectivo de preentrenamiento multimodal (texto + lenguaje de marcado) para la comprensión de documentos visualmente ricos y tareas de extracción de información, como preguntas y respuestas en páginas web y extracción de información de páginas web. MarkupLM logra los resultados SOTA en múltiples conjuntos de datos.

Como usar

Recomendamos referirse a la documentación y a los cuadernos de demostración.

from transformers import AutoModelForQuestionAnswering, AutoProcessor

model = AutoModelForQuestionAnswering.from_pretrained('microsoft/markuplm-large-finetuned-websrc')
processor = AutoProcessor.from_pretrained('microsoft/markuplm-large-finetuned-websrc')

# Usa el modelo y el procesador según tu caso de uso

Funcionalidades

Preentrenamiento multimodal (texto + lenguaje de marcado)
Comprensión de documentos visualmente ricos
Extracción de información
Preguntas y respuestas en páginas web
Resultados SOTA en múltiples conjuntos de datos

Casos de uso

Preguntas y respuestas en páginas web
Extracción de información de páginas web