Reconocimiento de estructura de tablas con transformadores v1.1 de Microsoft

microsoft

Detección de objetos

El modelo Table Transformer (pre-entrenado para el reconocimiento de estructuras de tablas) es un modelo de detección de objetos basado en Transformers equivalente al modelo DETR. Entrenado en FinTabNet.c, fue introducido en el artículo 'Aligning benchmark datasets for table structure recognition' por Smock et al. y lanzado por primera vez en este repositorio. Nota: El equipo que lanzó Table Transformer no escribió una tarjeta de modelo para este modelo, así que esta tarjeta fue escrita por el equipo de Hugging Face. Los autores decidieron usar la configuración 'normalizar antes' de DETR, lo que significa que la normalización de capa se aplica antes de la autoatención y la atención cruzada.

Como usar

Puede usar el modelo crudo para detectar tablas en documentos. Consulte la documentación para más información.

Funcionalidades

Modelo Transformer-based para detección de objetos
Normalización de capa antes de la autoatención y atención cruzada
Entregado en formato Safetensors
Tamaño del modelo: 28.8M parámetros
Tipo de tensor: F32

Casos de uso

Extracción de tablas de documentos PDF
Reconocimiento de estructuras de tablas en imágenes de PDF