ScamLLM

phishbot
Clasificación de texto

Nuestro modelo, 'ScamLLM', está diseñado para identificar prompts maliciosos que pueden ser usados para generar sitios web de phishing y correos electrónicos utilizando LLMs comerciales populares como ChatGPT, Bard y Claude. Este modelo se obtiene afinando un RoBERTa preentrenado utilizando un conjunto de datos que abarca múltiples conjuntos de prompts maliciosos. Pruebe 'ScamLLM' utilizando la API de inferencia. Nuestro modelo clasifica los prompts con 'Etiqueta 1' para significar la identificación de un intento de phishing, mientras que 'Etiqueta 0' denota un prompt considerado seguro y no malicioso.

Como usar

Hay múltiples maneras de probar este modelo, siendo la más simple usar la API de Inferencia, así como con la tubería de 'clasificación de texto' como se muestra a continuación:

from transformers import pipeline
classifier = pipeline(task="text-classification", model="phishbot/ScamLLM", top_k=None)
prompt = ["Your Sample Sentence or Prompt...."]
model_outputs = classifier(prompt)
print(model_outputs[0])

Si utiliza nuestro modelo en su investigación, por favor cite nuestro artículo 'From Chatbots to Phishbots?: Phishing Scam Generation in Commercial Large Language Models' (https://www.computer.org/csdl/proceedings-article/sp/2024/313000a221/1WPcYLpYFHy). BibTeX a continuación:

title={From Chatbots to Phishbots?: Phishing Scam Generation in Commercial Large Language Models},
author={Roy, Sayak Saha y Thota, Poojitha y Naragam, Krishna Vamsi y Nilizadeh, Shirin},
booktitle={2024 IEEE Symposium on Security and Privacy (SP)},
pages={221--221},
year={2024},
organization={IEEE Computer Society}

Funcionalidades

Clasificación de texto
Utiliza biblioteca Transformers
Compatible con Safetensors
Basado en RoBERTa
Compatible con AutoTrain
Compatible con Endpoints de Inferencia

Casos de uso

Identificación de sitios web de phishing
Detección de correos electrónicos maliciosos
Clasificación de prompts maliciosos y seguros