nypgd/fine-tuned-sentence-transformer_last
nypgd
Similitud de oraciones
Este es un modelo de sentence-transformers ajustado a partir de sentence-transformers/paraphrase-xlm-r-multilingual-v1. Mapea sentencias y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de texto, clustering y más.
Como usar
pip install -U sentence-transformers
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub de 🤗
model = SentenceTransformer("nypgd/fine-tuned-sentence-transformer_last")
# Ejecutar inferencia
sentences = [
"Eleanor Hunt'a ait kaç tane kiralama kimliği var?",
'CREATE TABLEcustomer (\n customer_id INTEGER PRIMARY KEY,\n store_id INTEGER,\n first_name TEXT,\n last_name TEXT,\n email TEXT,\n address_id INTEGER,\n active INTEGER,\n create_date DATETIME,\n last_update DATETIME,\n FOREIGN KEY (address_id) REFERENCES address(None),\n FOREIGN KEY (store_id) REFERENCES store(None)\n);',
'CREATE TABLEdistrict (\n District_ID INT PRIMARY KEY,\n District_name TEXT,\n Headquartered_City TEXT,\n City_Population REAL,\n City_Area REAL\n);',
]
embeddings = model.encode(sentences)
print(embeddings.shape) # [3, 768]
# Obtener los puntajes de similitud de las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape) # [3, 3]
Funcionalidades
- Modelo ajustado de sentence-transformers/paraphrase-xlm-r-multilingual-v1
- Longitud máxima de secuencia: 128 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud del coseno
Casos de uso
- Similitud textual semántica
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de texto
- Clustering