SentenceTransformer basado en vinai/phobert-base-v2

huudan123
Similitud de oraciones

Este es un modelo de sentence-transformers ajustado desde vinai/phobert-base-v2. Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para similares de textos semánticos, búsqueda semántica, minería de paráfrasis, clasificación de textos, agrupamiento y más.

Como usar

Uso directo (Sentence Transformers)

Primero, instala la biblioteca Sentence Transformers:

pip install -U sentence-transformers

Luego, puedes cargar este modelo y ejecutar inferencias.

from sentence_transformers import SentenceTransformer

# Descargar desde el Hub 🤗
model = SentenceTransformer("huudan123/stage1")

# Realizar inferencias
sentences = [
    'Báo đen đã editorialized chống lại những cuộc viếng_thăm của farrakhan với các nhà độc_tài châu phi .',
    'Báo đen đã viết về quá_khứ của farrakhan .',
    'Báo đen từ_chối yểm_trợ cho farrakhan .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Obtener las puntuaciones de similitud para las codificaciones
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Funcionalidades

Tipo de modelo: Sentence Transformer
Modelo base: vinai/phobert-base-v2
Longitud máxima de secuencia: 512 tokens
Dimensionalidad de la salida: 768 tokens
Función de similitud: Similitud Coseno

Casos de uso

Similitud textual semántica
Búsqueda semántica
Minería de paráfrasis
Clasificación de textos
Agrupamiento