huudan123/stage4_1
huudan123
Similitud de oraciones
Este es un modelo de transformadores de oraciones ajustado desde huudan123/stag_123_cp8000. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede utilizar para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupación, y más.
Como usar
Primero instala la biblioteca de Transformadores de Oraciones:
pip install -U sentence-transformers
Luego puedes cargar este modelo y ejecutar inferencias.
from sentence_transformers import SentenceTransformer
# Descargar desde el Hub
model = SentenceTransformer("huudan123/stage4_1")
# Ejecutar inferencia
sentences = [
'Một người đàn ông đang lắp ráp các bộ phận loa.',
'Một người đàn ông đang đi bộ trên vỉa hè.',
'Một người đàn ông phun nước từ vòi cho một người đàn ông khác.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Para más detalles, por favor consulta la Documentación de Sentence Transformers y el repositorio de Sentence Transformers en GitHub.
Funcionalidades
- Modelo de transformadores de oraciones
- Modelo base: huudan123/stag_123_cp8000
- Longitud máxima de secuencia: 512 tokens
- Dimensionalidad de salida: 768 tokens
- Función de similitud: Similitud Coseno
Casos de uso
- Similitud semántica textual
- Búsqueda semántica
- Minería de paráfrasis
- Clasificación de textos
- Agrupación