LENU - Comprensión del Nombre de Entidad Legal para España

Sociovestix
Clasificación de texto

Un modelo Bert (multilingüe sin mayúsculas) afinado en nombres de entidades legales españolas (jurisdicción ES) del Sistema Global de Identificadores de Entidades Legales (LEI) con el objetivo de detectar Códigos de Forma Legal de Entidad (ELF). El modelo ha sido creado como parte de una colaboración entre la Fundación Global de Identificadores de Entidades Legales (GLEIF) y Sociovestix Labs con el objetivo de explorar cómo el Aprendizaje Automático puede apoyar en la detección del código ELF basado únicamente en el nombre legal de una entidad y la jurisdicción legal. El modelo se ha entrenado en el conjunto de datos lenu, con un enfoque en entidades legales españolas y códigos ELF dentro de la Jurisdicción 'ES'.

Como usar

El formulario legal de una entidad es un componente crucial al verificar y examinar la identidad organizativa. La amplia variedad de formas legales de entidades que existen dentro y entre jurisdicciones ha dificultado a las organizaciones grandes capturar la forma legal como datos estructurados. Los modelos específicos de jurisdicción de lenu, entrenados en entidades de la base de datos de Identificadores de Entidades Legales (LEI) de GLEIF, con más de dos millones de registros, permitirán a bancos, firmas de inversión, corporaciones, gobiernos y otras grandes organizaciones analizar retrospectivamente sus datos maestros, extraer la forma legal del texto no estructurado del nombre legal y aplicar de manera uniforme un código ELF a cada tipo de entidad según el estándar ISO 20275.

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Safetensors
BERT

Casos de uso

Análisis retrospectivo de datos maestros de grandes organizaciones
Extracción del formulario legal de texto no estructurado
Aplicación uniforme de códigos ELF a tipos de entidades