microsoft/markuplm-base-finetuned-websrc

microsoft
Pregunta y respuesta

MarkupLM es un método simple pero efectivo de preentrenamiento multimodal de texto y lenguaje de marcado para la comprensión de documentos visualmente ricos y tareas de extracción de información, como preguntas y respuestas en páginas web y extracción de información en páginas web. MarkupLM alcanza los resultados SOTA en múltiples conjuntos de datos. Para más detalles, consulte nuestro artículo: MarkupLM: Pre-training of Text and Markup Language for Visually-rich Document Understanding Junlong Li, Yiheng Xu, Lei Cui, Furu Wei.

Como usar

Nos referimos a la documentación y los cuadernos de demostración.

# Ejemplo de uso del modelo
"text":"Where do I live?","context":"My name is Wolfgang and I live in Berlin"
"text":"Where do I live?","context":"My name is Sarah and I live in London"
"text":"What's my name?","context":"My name is Clara and I live in Berkeley."
"text":"Which name is also used to describe the Amazon rainforest in English?","context":"The Amazon rainforest ... The Amazon represents over half of the planet's remaining rainforests, and comprises the largest and most biodiverse tract of tropical rainforest in the world, with an estimated 390 billion individual trees divided into 16,000 species."

Funcionalidades

Preentrenamiento multimodal (texto + lenguaje de marcado) para la IA de Documentos
Comprensión de documentos visualmente ricos
Tareas de extracción de información
Preguntas y respuestas en páginas web

Casos de uso

Preguntas y respuestas en páginas web
Extracción de información en páginas web