deutsche-telekom/gbert-large-paraphrase-cosine
deutsche-telekom
Similitud de oraciones
Este es un modelo de sentence-transformers. Convierte oraciones y párrafos (texto) en un espacio vectorial denso de 1024 dimensiones. El modelo está destinado a ser utilizado junto con SetFit para mejorar la clasificación de texto con pocas muestras en alemán. Tiene un modelo hermano llamado deutsche-telekom/gbert-large-paraphrase-euclidean. Este modelo está basado en deepset/gbert-large. ¡Muchas gracias a deepset! Utiliza la función de pérdida MultipleNegativesRankingLoss con similitud coseno como función de pérdida. El modelo está entrenado en un conjunto de datos cuidadosamente filtrado de deutsche-telekom/ger-backtrans-paraphrase.
Como usar
# Ejemplo de cómo utilizar el modelo
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('deutsche-telekom/gbert-large-paraphrase-cosine')
embeddings = model.encode(['Esta es una oración de ejemplo', 'Aquí hay otra oración'])
print(embeddings)
Funcionalidades
- Conversión de oraciones y párrafos a vectores densos de 1024 dimensiones
- Mejora de la clasificación de texto con pocas muestras en alemán
- Utiliza SetFit para mejores resultados en pocas muestras
- Función de pérdida: MultipleNegativesRankingLoss con similitud coseno
- Basado en deepset/gbert-large
Casos de uso
- Clasificación de texto con pocas muestras en alemán
- Extracción de características de texto
- Embeddings de texto para comparaciones semánticas