hellonlp/promcse-bert-base-zh
hellonlp
Similitud de oraciones
PromCSE(sup) es un modelo de Hugging Face enfocado en la similitud de oraciones en chino utilizando transformadores y PyTorch. Está diseñado para la inferencia de incrustaciones de texto.
Como usar
Para usar esta herramienta, primero instale el paquete promcse desde PyPI
pip install promcse
Después de instalar el paquete, puede cargar nuestro modelo con estas dos líneas de código
from promcse import PromCSE
model = PromCSE("hellonlp/promcse-bert-base-zh", "cls", 10)
Luego puede usar nuestro modelo para codificar oraciones en incrustaciones
embeddings = model.encode("武汉是一个美丽的城市。")
print(embeddings.shape)
#torch.Size([768])
Calcule las similitudes de coseno entre dos grupos de oraciones
sentences_a = ['你好吗']
sentences_b = ['你怎么样','我吃了一个苹果','你过的好吗','你还好吗','你','你好不好','你好不好呢','我不开心','我好开心啊', '你吃饭了吗','你好吗','你现在好吗','你好个鬼']
similarities = model.similarity(sentences_a, sentences_b)
print(similarities)
# [(1.0, '你好吗'),
# (0.9167, '你好不好'),
# (0.8956, '你好不好呢'),
# (0.8431, '你还好吗'),
# (0.7919, '你怎么样'),
# (0.7649, '你现在好吗'),
# (0.7458, '你过的好吗'),
# (0.6844, '你好个鬼'),
# (0.6177, '你'),
# (0.5654, '你吃饭了吗'),
# (0.3612, '我好开心啊'),
# (0.1875, '我不开心'),
# (0.0866, '我吃了一个苹果')]
Funcionalidades
- Modelo basado en BERT para la similitud de oraciones
- Soporte para inferencias de texto
- Implementaciones en PyTorch
- Capacidad para generar incrustaciones de oraciones
- Incluye diversos datasets chinos para entrenamiento y evaluación
Casos de uso
- Comparar la similitud entre oraciones en chino
- Generar incrustaciones de texto para tareas de NLP
- Realizar inferencias para similitud de oraciones