protectai/codebert-base-Malicious_URLs-onnx
protectai
Clasificaci贸n de texto
Esta versi贸n ONNX de DunnBC22/codebert-base-Malicious_URLs es una conversi贸n del modelo original para identificar URLs que pueden representar amenazas de seguridad. El modelo se basa en la arquitectura CodeBERT y fue convertido a ONNX usando la biblioteca 馃 Optimum.
Como usar
Para cargar el modelo se requiere tener instalada la biblioteca 馃 Optimum.
from optimum.onnxruntime import ORTModelForSequenceClassification
from transformers import AutoTokenizer, pipeline
tokenizer = AutoTokenizer.from_pretrained("laiyer/codebert-base-Malicious_URLs-onnx")
model = ORTModelForSequenceClassification.from_pretrained("laiyer/codebert-base-Malicious_URLs-onnx")
classifier = pipeline(
task="text-classification",
model=model,
tokenizer=tokenizer,
top_k=None,
)
classifier_output = classifier("https://google.com")
print(classifier_output)
Funcionalidades
- Arquitectura Base: CodeBERT-base, un modelo robusto para lenguajes de programaci贸n y naturales.
- Dataset: https://www.kaggle.com/datasets/sid321axn/malicious-urls-dataset.
- Modificaciones: Detalles de cualquier modificaci贸n o ajuste fino realizado para adaptar el modelo a la detecci贸n de URLs maliciosas.
Casos de uso
- Esc谩ner de URLs maliciosas
- Detecci贸n de amenazas de seguridad en URLs