Microsoft Table Transformer (Reconocimiento de Estructura de Tablas) V1.1
microsoft
Detección de objetos
El Transformer de Tablas (preentrenado para el Reconocimiento de Estructura de Tablas). El modelo Transformer de Tablas (TATR) está entrenado en PubTables1M. Fue presentado en el artículo 'Alineando conjuntos de datos de referencia para el reconocimiento de estructura de tablas' por Smock et al. y lanzado por primera vez en este repositorio. El Transformer de Tablas es equivalente a DETR, un modelo de detección de objetos basado en Transformadores. Cabe mencionar que los autores decidieron usar la configuración 'normalizar antes' de DETR, lo que significa que layernorm se aplica antes de la auto-atención y la atención cruzada.
Como usar
Puedes usar el modelo raw para detectar tablas en documentos. Consulta la documentación para más información.
Funcionalidades
- Reconocimiento de estructuras de tablas en documentos
- Basado en el modelo de Transformadores DETR
- Capaz de detectar tablas en imágenes de PDF
Casos de uso
- Extracción de tablas en imágenes de PDF
- Reconocimiento de estructuras de tablas en documentos digitalizados