huudan123/model_stage4

huudan123

Similitud de oraciones

Este es un modelo de transformadores de oraciones ajustado a partir de huudan123/model_stage3_2_score. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y puede ser utilizado para la similitud textual semántica, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupamiento y más.

Como usar

Uso Directo (Transformadores de Oraciones)
from sentence_transformers import SentenceTransformer

# Descargar desde el Hub de 🤗
model = SentenceTransformer("huudan123/model_stage4")
# Ejecutar inferencia
sentences = [
    'Một người đàn ông đang lắp ráp các bộ phận loa.',
    'Một người đàn ông đang đi bộ trên vỉa hè.',
    'Một người đàn ông phun nước từ vòi cho một người đàn ông khác.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener las puntuaciones de similitud para las incrustaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Modelo de transformadores de oraciones
Basado en huudan123/model_stage3_2_score
Longitud máxima de secuencia: 512 tokens
Dimensionalidad de salida: 768 tokens
Función de similitud: Similitud de coseno
Arquitectura del modelo incluye RobertaModel

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de textos
Agrupamiento