Transformer de Tablas (afinada para la Detección de Tablas)
microsoft
Detección de objetos
El Transformer de Tablas (DETR) modelo entrenado en PubTables1M. Fue introducido en el artículo PubTables-1M: Hacia la Extracción Completa de Tablas de Documentos No Estructurados por Smock et al. y lanzado por primera vez en este repositorio. El Transformer de Tablas es equivalente a DETR, un modelo de detección de objetos basado en Transformers. Es importante notar que los autores decidieron usar la configuración de 'normalizar antes' de DETR, lo que significa que layernorm se aplica antes de la auto-atención y la atención cruzada.
Como usar
Puedes usar el modelo en bruto para detectar tablas en documentos. Consulta la documentación para más información.
Funcionalidades
- Detección de objetos
- Basado en Transformers
- Modelo afinado para detección de tablas
- Configuración de 'normalizar antes' para DETR
Casos de uso
- Extracción de tablas de documentos PDF
- Reconocimiento de estructura de tablas en imágenes
- Transformación de tablas en formato CSV