Reconocimiento de Estructura de Tabla con Transformer (table-transformer-structure-recognition)
microsoft
Detección de objetos
El modelo Table Transformer, también conocido como DETR, es un modelo de detección de objetos basado en Transformers entrenado en el conjunto de datos PubTables1M. Fue presentado en el artículo PubTables-1M: Hacia una Extracción Completa de Tablas de Documentos No Estructurados por Smock et al. Este modelo utiliza la configuración 'normalizar antes' del DETR, lo que significa que se aplica 'layernorm' antes de la auto y cruz-atención. Se puede usar para detectar la estructura de tablas, como filas y columnas.
Como usar
Puedes usar el modelo crudo para detectar la estructura (como filas y columnas) en tablas. Consulta la documentación para más información.
Funcionalidades
- Reconocimiento de la estructura de las tablas (filas y columnas)
- Modelo basado en Transformers (DETR)
- Entrenado en el conjunto de datos PubTables1M
- Configuración 'normalizar antes'
Casos de uso
- Detección y extracción de tablas en documentos PDFs e imágenes
- Conversión de tablas de imagen a formatos estructurados como CSV