Reconocimiento de Estructura de Tabla con Transformer (table-transformer-structure-recognition)

microsoft
Detección de objetos

El modelo Table Transformer, también conocido como DETR, es un modelo de detección de objetos basado en Transformers entrenado en el conjunto de datos PubTables1M. Fue presentado en el artículo PubTables-1M: Hacia una Extracción Completa de Tablas de Documentos No Estructurados por Smock et al. Este modelo utiliza la configuración 'normalizar antes' del DETR, lo que significa que se aplica 'layernorm' antes de la auto y cruz-atención. Se puede usar para detectar la estructura de tablas, como filas y columnas.

Como usar

Puedes usar el modelo crudo para detectar la estructura (como filas y columnas) en tablas. Consulta la documentación para más información.

Funcionalidades

Reconocimiento de la estructura de las tablas (filas y columnas)
Modelo basado en Transformers (DETR)
Entrenado en el conjunto de datos PubTables1M
Configuración 'normalizar antes'

Casos de uso

Detección y extracción de tablas en documentos PDFs e imágenes
Conversión de tablas de imagen a formatos estructurados como CSV