jpwahle/longformer-base-plagiarism-detection

jpwahle

Clasificación de texto

Longformer-base para la detección de plagio es un modelo entrenado específicamente para identificar textos parafraseados por herramientas automáticas como SpinBot y SpinnerChief, lo que representa una grave amenaza para la integridad académica. Este modelo evalúa la efectividad de cinco modelos de embeddings pre-entrenados combinados con clasificadores de aprendizaje automático y modelos de lenguaje neural de última generación.

Como usar

El modelo se puede cargar para realizar la detección de plagio de la siguiente manera:
from transformers import AutoModelForSequenceClassification, AutoTokenizer

AutoModelForSequenceClassification("jpelhaw/longformer-base-plagiarism-detection")
AutoTokenizer.from_pretrained("jpelhaw/longformer-base-plagiarism-detection")

input = "El plagio es la representación del escrito, pensamientos, ideas o expresiones de otro autor como si fueran propias."

example = tokenizer.tokenize(input, add_special_tokens=True)

answer = model(**example)

# "plagiado"

Funcionalidades

Clasificación de texto
Basado en Transformers
Compatible con PyTorch
Soporte para Safetensors
Característica de compatibilidad con AutoTrain
Compatibilidad con Inference Endpoints

Casos de uso

Detección de textos parafraseados automáticamente en trabajos de investigación
Identificación de plagio en tesis de graduación
Verificación de integridad en artículos de Wikipedia