Detector de Paráfrasis Adversarial

AMHR

Clasificación de texto

Este modelo es un detector de paráfrasis entrenado en los conjuntos de datos de Paráfrasis Adversary descritos y utilizados en este artículo: https://aclanthology.org/2021.acl-long.552/. El modelo está diseñado para identificar paráfrasis al aplicar un paradigma adversarial, generando pares de oraciones semánticamente equivalentes pero léxicamente y sintácticamente diferentes. Estas oraciones pueden ser usadas tanto para probar modelos de identificación de paráfrasis como para mejorar su desempeño.

Como usar

Por favor cite el siguiente artículo si usa este modelo:
@inproceedings{nighojkar-licato-2021-improving,
  title = "Improving Paraphrase Detection with the Adversarial Paraphrasing Task",
  author = "Nighojkar, Animesh  and Licato, John",
  booktitle = "Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
  month = aug,
  year = "2021",
  address = "Online",
  publisher = "Association for Computational Linguistics",
  url = "https://aclanthology.org/2021.acl-long.552",
  pages = "7106--7116",
  abstract = "Si dos oraciones tienen el mismo significado, deberían ser equivalentes en sus propiedades inferenciales, es decir, cada oración debería implicar textualmente a la otra. Sin embargo, muchos conjuntos de datos de paráfrasis actualmente en uso dependen de un sentido de paráfrasis basado en la superposición de palabras y sintaxis. ¿Podemos enseñarlos a identificar paráfrasis de una manera que se base en las propiedades inferenciales de las oraciones y no en las similitudes léxicas y sintácticas de un par de oraciones? Aplicamos el paradigma adversarial a esta pregunta e introducimos un nuevo método adversarial de creación de conjuntos de datos para la identificación de paráfrasis: la Tarea de Paráfrasis Adversarial (APT), que pide a los participantes generar paráfrasis semánticamente equivalentes (en el sentido de mutua implicación) pero léxicamente y sintácticamente dispares. Estos pares de oraciones pueden ser usados tanto para probar modelos de identificación de paráfrasis (que apenas alcanzan una precisión aleatoria) como para mejorar su desempeño. Para acelerar la generación de conjuntos de datos, exploramos la automatización de la APT usando T5 y mostramos que el conjunto de datos resultante también mejora la precisión. Discutimos las implicaciones para la detección de paráfrasis y publicamos nuestro conjunto de datos con la esperanza de mejorar los modelos de detección de paráfrasis para que sean capaces de detectar equivalencia de significado a nivel de oración.",
}

Funcionalidades

Clasificación de texto
Compatible con Transformers
Usa PyTorch
Utiliza Safetensors
Basado en el modelo RoBERTa
Compatible con AutoTrain
Compatible con Inference Endpoints

Casos de uso

Detección de paráfrasis en texto
Mejorar la precisión de modelos de identificación de paráfrasis
Creación de conjuntos de datos adversariales para pruebas robustas de modelos