optimum/sbert-all-MiniLM-L6-with-pooler
optimum
Similitud de oraciones
Este es un modelo de sentence-transformers en formato ONNX: Mapea oraciones y párrafos a un espacio vectorial denso de 384 dimensiones y se puede usar para tareas como clustering o búsqueda semántica.
Como usar
Usar este modelo es fácil cuando tienes instalado Optimum:
python -m pip install optimum
Luego puedes usar el modelo así:
from optimum.onnxruntime.modeling_ort import ORTModelForCustomTasks
model = ORTModelForCustomTasks.from_pretrained("optimum/sbert-all-MiniLM-L6-with-pooler")
tokenizer = AutoTokenizer.from_pretrained("optimum/sbert-all-MiniLM-L6-with-pooler")
inputs = tokenizer("¡Me encantan los burritos!", return_tensors="pt")
pred = model(**inputs)
También podrás aprovechar la API de pipeline en transformers:
from transformers import pipeline
onnx_extractor = pipeline("feature-extraction", model=model, tokenizer=tokenizer)
texto = "¡Me encantan los burritos!"
pred = onnx_extractor(texto)
Funcionalidades
- Transformación de características
- Inferencia de incrustaciones de texto
- Compatible con ONNX
Casos de uso
- Codificación de oraciones y párrafos cortos
- Recuperación de información
- Clustering
- Tareas de similitud de oraciones