xl-lexeme

pierluigic

Similitud de oraciones

Este modelo está basado en sentence-transformers: Mapea una palabra objetivo en oraciones a un espacio vectorial denso de 1024 dimensiones y puede ser utilizado para tareas como agrupamiento (clustering) o búsqueda semántica.

Como usar

Instala la biblioteca:
git clone [email protected]:pierluigic/xl-lexeme.git
cd xl-lexeme
pip3 install .

Entonces puedes usar el modelo de la siguiente manera:
from WordTransformer import WordTransformer, InputExample

model = WordTransformer('pierluigic/xl-lexeme')
examples = InputExample(texts="the quick fox jumps over the lazy dog", positions=[10,13])
fox_embedding = model.encode(examples) #La representación de la palabra objetivo "fox"

Funcionalidades

Transformadores (Transformers)
Entrenado con pérdidas contrastivas (Contrastive Loss)
Soporte para búsqueda semántica y agrupamiento
Vector de densidad 1024
Soporte para PyTorch
Compatible con AutoTrain
Extracción de características
Similitud de palabras y oraciones

Casos de uso

Agrupamiento de palabras en oraciones
Búsqueda semántica
Extracción de características de oraciones
Transformación y análisis de similitud entre palabras y oraciones