sbert-base-chinese-nli
Este es el modelo de incrustación de oraciones preentrenado por UER-py, que se presenta en este documento. Además, el modelo también podría ser preentrenado por TencentPretrain, introducido en este documento, que hereda UER-py para soportar modelos con más de mil millones de parámetros y lo extiende a un marco de preentrenamiento multimodal.
Como usar
Puedes usar este modelo para extraer incrustaciones de oraciones para la tarea de similitud de oraciones. Utilizamos la distancia coseno para calcular la similitud de las incrustaciones aquí:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('uer/sbert-base-chinese-nli')
sentences = ['那个人很开心', '那个人非常开心']
sentence_embeddings = model.encode(sentences)
from sklearn.metrics.pairwise import paired_cosine_distances
cosine_score = 1 - paired_cosine_distances([sentence_embeddings[0]], [sentence_embeddings[1]])
El modelo está ajustado por UER-py en la nube de Tencent. Afinamos cinco épocas con una longitud de secuencia de 128 sobre la base del modelo preentrenado chinese_roberta_L-12_H-768. Al final de cada época, el modelo se guarda cuando se logra el mejor rendimiento en el conjunto de desarrollo.
python3 finetune/run_classifier_siamese.py --pretrained_model_path models/cluecorpussmall_roberta_base_seq512_model.bin-250000 \
--vocab_path models/google_zh_vocab.txt \
--config_path models/sbert/base_config.json \
--train_path datasets/ChineseTextualInference/train.tsv \
--dev_path datasets/ChineseTextualInference/dev.tsv \
--learning_rate 5e-5 --epochs_num 5 --batch_size 64
Finalmente, convertimos el modelo preentrenado al formato de Huggingface:
python3 scripts/convert_sbert_from_uer_to_huggingface.py --input_model_path models/finetuned_model.bin \
--output_model_path pytorch_model.bin \
--layers_num 12
Funcionalidades
- Similitud de oraciones
- Transformadores de oraciones
- PyTorch
- Transformadores
- Extracción de características
- Inferencia de incrustaciones de texto
- Puntos finales de inferencia
Casos de uso
- Medir la similitud entre oraciones
- Extracción de características de texto
- Aplicaciones de inferencia de texto como ChatPDF