ealvaradob/bert-finetuned-phishing
ealvaradob
Clasificación de texto
Este modelo es una versión mejorada de bert-large-uncased en un conjunto de datos de phishing, capaz de detectar phishing en sus cuatro formas más comunes: URLs, correos electrónicos, mensajes SMS e incluso sitios web. El modelo logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.1953 - Precisión: 0.9717 - Precisión: (Manual) 0.9658 - Recall: 0.9670 - Tasa de falsos positivos: 0.0249
Como usar
Ejemplo de uso del modelo:
from transformers import BertForSequenceClassification, BertTokenizer
tokenizer = BertTokenizer.from_pretrained('ealvaradob/bert-finetuned-phishing')
model = BertForSequenceClassification.from_pretrained('ealvaradob/bert-finetuned-phishing')
inputs = tokenizer('Texto de prueba', return_tensors='pt')
outputs = model(**inputs)
Funcionalidades
- Modelo BERT preentrenado
- 24 capas
- Dimensión oculta de 1024
- 16 cabezas de atención
- 336 millones de parámetros
- Detecta phishing en URLs, correos electrónicos, mensajes SMS y sitios web
Casos de uso
- Detección de URLs de phishing
- Identificación de correos electrónicos de phishing
- Reconocimiento de mensajes SMS de phishing
- Detección de sitios web de phishing