xl-lexeme
pierluigic
Similitud de oraciones
Este modelo está basado en sentence-transformers: Mapea una palabra objetivo en oraciones a un espacio vectorial denso de 1024 dimensiones y puede ser utilizado para tareas como agrupamiento (clustering) o búsqueda semántica.
Como usar
Instala la biblioteca:
git clone [email protected]:pierluigic/xl-lexeme.git
cd xl-lexeme
pip3 install .
Entonces puedes usar el modelo de la siguiente manera:
from WordTransformer import WordTransformer, InputExample
model = WordTransformer('pierluigic/xl-lexeme')
examples = InputExample(texts="the quick fox jumps over the lazy dog", positions=[10,13])
fox_embedding = model.encode(examples) #La representación de la palabra objetivo "fox"
Funcionalidades
- Transformadores (Transformers)
- Entrenado con pérdidas contrastivas (Contrastive Loss)
- Soporte para búsqueda semántica y agrupamiento
- Vector de densidad 1024
- Soporte para PyTorch
- Compatible con AutoTrain
- Extracción de características
- Similitud de palabras y oraciones
Casos de uso
- Agrupamiento de palabras en oraciones
- Búsqueda semántica
- Extracción de características de oraciones
- Transformación y análisis de similitud entre palabras y oraciones