hellonlp/promcse-bert-base-zh

hellonlp

Similitud de oraciones

PromCSE(sup) es un modelo de Hugging Face enfocado en la similitud de oraciones en chino utilizando transformadores y PyTorch. Está diseñado para la inferencia de incrustaciones de texto.

Como usar

Para usar esta herramienta, primero instale el paquete promcse desde PyPI
pip install promcse

Después de instalar el paquete, puede cargar nuestro modelo con estas dos líneas de código
from promcse import PromCSE
model = PromCSE("hellonlp/promcse-bert-base-zh", "cls", 10)

Luego puede usar nuestro modelo para codificar oraciones en incrustaciones
embeddings = model.encode("武汉是一个美丽的城市。")
print(embeddings.shape)
#torch.Size([768])

Calcule las similitudes de coseno entre dos grupos de oraciones
sentences_a = ['你好吗']
sentences_b = ['你怎么样','我吃了一个苹果','你过的好吗','你还好吗','你','你好不好','你好不好呢','我不开心','我好开心啊', '你吃饭了吗','你好吗','你现在好吗','你好个鬼']
similarities = model.similarity(sentences_a, sentences_b)
print(similarities)
# [(1.0, '你好吗'),
#  (0.9167, '你好不好'),
#  (0.8956, '你好不好呢'),
#  (0.8431, '你还好吗'),
#  (0.7919, '你怎么样'),
#  (0.7649, '你现在好吗'),
#  (0.7458, '你过的好吗'),
#  (0.6844, '你好个鬼'),
#  (0.6177, '你'),
#  (0.5654, '你吃饭了吗'),
#  (0.3612, '我好开心啊'),
#  (0.1875, '我不开心'),
#  (0.0866, '我吃了一个苹果')]

Funcionalidades

Modelo basado en BERT para la similitud de oraciones
Soporte para inferencias de texto
Implementaciones en PyTorch
Capacidad para generar incrustaciones de oraciones
Incluye diversos datasets chinos para entrenamiento y evaluación

Casos de uso

Comparar la similitud entre oraciones en chino
Generar incrustaciones de texto para tareas de NLP
Realizar inferencias para similitud de oraciones