ealvaradob/bert-finetuned-phishing

ealvaradob

Clasificación de texto

Este modelo es una versión mejorada de bert-large-uncased en un conjunto de datos de phishing, capaz de detectar phishing en sus cuatro formas más comunes: URLs, correos electrónicos, mensajes SMS e incluso sitios web. El modelo logra los siguientes resultados en el conjunto de evaluación: - Pérdida: 0.1953 - Precisión: 0.9717 - Precisión: (Manual) 0.9658 - Recall: 0.9670 - Tasa de falsos positivos: 0.0249

Como usar

Ejemplo de uso del modelo:
from transformers import BertForSequenceClassification, BertTokenizer

tokenizer = BertTokenizer.from_pretrained('ealvaradob/bert-finetuned-phishing')
model = BertForSequenceClassification.from_pretrained('ealvaradob/bert-finetuned-phishing')

inputs = tokenizer('Texto de prueba', return_tensors='pt')
outputs = model(**inputs)

Funcionalidades

Modelo BERT preentrenado
24 capas
Dimensión oculta de 1024
16 cabezas de atención
336 millones de parámetros
Detecta phishing en URLs, correos electrónicos, mensajes SMS y sitios web

Casos de uso

Detección de URLs de phishing
Identificación de correos electrónicos de phishing
Reconocimiento de mensajes SMS de phishing
Detección de sitios web de phishing