jpwahle/longformer-base-plagiarism-detection
jpwahle
Clasificación de texto
Longformer-base para la detección de plagio es un modelo entrenado específicamente para identificar textos parafraseados por herramientas automáticas como SpinBot y SpinnerChief, lo que representa una grave amenaza para la integridad académica. Este modelo evalúa la efectividad de cinco modelos de embeddings pre-entrenados combinados con clasificadores de aprendizaje automático y modelos de lenguaje neural de última generación.
Como usar
El modelo se puede cargar para realizar la detección de plagio de la siguiente manera:
from transformers import AutoModelForSequenceClassification, AutoTokenizer
AutoModelForSequenceClassification("jpelhaw/longformer-base-plagiarism-detection")
AutoTokenizer.from_pretrained("jpelhaw/longformer-base-plagiarism-detection")
input = "El plagio es la representación del escrito, pensamientos, ideas o expresiones de otro autor como si fueran propias."
example = tokenizer.tokenize(input, add_special_tokens=True)
answer = model(**example)
# "plagiado"
Funcionalidades
- Clasificación de texto
- Basado en Transformers
- Compatible con PyTorch
- Soporte para Safetensors
- Característica de compatibilidad con AutoTrain
- Compatibilidad con Inference Endpoints
Casos de uso
- Detección de textos parafraseados automáticamente en trabajos de investigación
- Identificación de plagio en tesis de graduación
- Verificación de integridad en artículos de Wikipedia