deutsche-telekom/gbert-large-paraphrase-cosine

deutsche-telekom
Similitud de oraciones

Este es un modelo de sentence-transformers. Convierte oraciones y párrafos (texto) en un espacio vectorial denso de 1024 dimensiones. El modelo está destinado a ser utilizado junto con SetFit para mejorar la clasificación de texto con pocas muestras en alemán. Tiene un modelo hermano llamado deutsche-telekom/gbert-large-paraphrase-euclidean. Este modelo está basado en deepset/gbert-large. ¡Muchas gracias a deepset! Utiliza la función de pérdida MultipleNegativesRankingLoss con similitud coseno como función de pérdida. El modelo está entrenado en un conjunto de datos cuidadosamente filtrado de deutsche-telekom/ger-backtrans-paraphrase.

Como usar

# Ejemplo de cómo utilizar el modelo
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('deutsche-telekom/gbert-large-paraphrase-cosine')
embeddings = model.encode(['Esta es una oración de ejemplo', 'Aquí hay otra oración'])
print(embeddings)

Funcionalidades

Conversión de oraciones y párrafos a vectores densos de 1024 dimensiones
Mejora de la clasificación de texto con pocas muestras en alemán
Utiliza SetFit para mejores resultados en pocas muestras
Función de pérdida: MultipleNegativesRankingLoss con similitud coseno
Basado en deepset/gbert-large

Casos de uso

Clasificación de texto con pocas muestras en alemán
Extracción de características de texto
Embeddings de texto para comparaciones semánticas