optimum/sbert-all-MiniLM-L6-with-pooler

optimum
Similitud de oraciones

Este es un modelo de sentence-transformers en formato ONNX: Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y se puede usar para tareas como clustering o búsqueda semántica.

Como usar

Usar este modelo es fácil cuando tienes instalado Optimum:

python -m pip install optimum

Luego puedes usar el modelo así:

from optimum.onnxruntime.modeling_ort import ORTModelForCustomTasks

model = ORTModelForCustomTasks.from_pretrained("optimum/sbert-all-MiniLM-L6-with-pooler")
tokenizer = AutoTokenizer.from_pretrained("optimum/sbert-all-MiniLM-L6-with-pooler")
inputs = tokenizer("¡Me encantan los burritos!", return_tensors="pt")
pred = model(**inputs)

También podrás aprovechar la API de pipeline en transformers:

from transformers import pipeline

onnx_extractor = pipeline("feature-extraction", model=model, tokenizer=tokenizer)
texto = "¡Me encantan los burritos!"
pred = onnx_extractor(texto)

Funcionalidades

Transformación de características
Inferencia de incrustaciones de texto
Compatible con ONNX

Casos de uso

Codificación de oraciones y párrafos cortos
Recuperación de información
Clustering
Tareas de similitud de oraciones