radlab/polish-cross-encoder

radlab
Similitud de oraciones

Este es un modelo basado en transformadores de oraciones (`sentence-transformers`) utilizado para la similitud de oraciones. Fue entrenado con el conjunto de datos `radlab/polish-sts-dataset` y puede aplicarse en tareas de clasificación de texto, extracción de características, y generación de inferencias embebidas de texto.

Como usar

A continuación se muestra un ejemplo de uso del modelo:

from sentence_transformers.cross_encoder import CrossEncoder

model_path = "radlab/polish-cross-encoder"
model = CrossEncoder(model_path)

questions = [
"Jaką mamy dziś pogodę? bo Andrzej nic nie mówił.",
"Gdzie jedzie Andrzej? Bo wczoraj był w Warszawie.",
"Czy oskarżony się zgadza z przedstawionym wyrokiem?",
]
answers = [
"Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.",
"Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.",
"Wyrok jest prawomocny i nie podlega dalszym rozważaniom.",
]
for question in questions:
    context_with_question = [(s, question) for s in answers]
    results = sorted(
        {idx: r for idx, r in enumerate(model.predict(context_with_question))}.items(),
        key=lambda x: x[1],
        reverse=True,
    )

    print(f"QUESTION: {question}")
    print("ANSWERS (sorted):")
    for idx, score in results:
        print(f"\t[{score}]\t{answers[idx]}")
    print("")

Y el output estándar es:

QUESTION: Jaką mamy dziś pogodę? bo Andrzej nic nie mówił.
ANSWERS (sorted):
[0.016749681904911995]  Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.
[0.01602918468415737]   Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.
[0.016013670712709427]  Wyrok jest prawomocny i nie podlega dalszym rozważaniom.

QUESTION: Gdzie jedzie Andrzej? Bo wczoraj był w Warszawie.
ANSWERS (sorted):
[0.5997582674026489]    Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.
[0.4528200924396515]    Wyrok jest prawomocny i nie podlega dalszym rozważaniom.
[0.17350871860980988]   Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.

QUESTION: Czy oskarżony się zgadza z przedstawionym wyrokiem?
ANSWERS (sorted):
[0.8431766629219055]    Wyrok jest prawomocny i nie podlega dalszym rozważaniom.
[0.6823258996009827]    Poada deszcz i jest wilgotno, jednak wczoraj było słonecznie.
[0.558414101600647]     Pan Andrzej siedzi w pociągu i jedzie do Wiednia. Ogląda na telefonie zabawne filmiki.

Funcionalidades

Similitud de oraciones
Transformadores de oraciones
Compatibilidad con PyTorch
Clasificación de texto
Extracción de características
Inferencias embebidas de texto

Casos de uso

Clasificación de texto basada en similitud de oraciones
Extracción de características de texto
Generación de inferencias embebidas de texto
Mejorar la precisión en tareas de búsqueda de información
Emparejamiento de preguntas y respuestas en sistemas conversacionales