ScamLLM
Nuestro modelo, 'ScamLLM', está diseñado para identificar prompts maliciosos que pueden ser usados para generar sitios web de phishing y correos electrónicos utilizando LLMs comerciales populares como ChatGPT, Bard y Claude. Este modelo se obtiene afinando un RoBERTa preentrenado utilizando un conjunto de datos que abarca múltiples conjuntos de prompts maliciosos. Pruebe 'ScamLLM' utilizando la API de inferencia. Nuestro modelo clasifica los prompts con 'Etiqueta 1' para significar la identificación de un intento de phishing, mientras que 'Etiqueta 0' denota un prompt considerado seguro y no malicioso.
Como usar
Hay múltiples maneras de probar este modelo, siendo la más simple usar la API de Inferencia, así como con la tubería de 'clasificación de texto' como se muestra a continuación:
from transformers import pipeline
classifier = pipeline(task="text-classification", model="phishbot/ScamLLM", top_k=None)
prompt = ["Your Sample Sentence or Prompt...."]
model_outputs = classifier(prompt)
print(model_outputs[0])
Si utiliza nuestro modelo en su investigación, por favor cite nuestro artículo 'From Chatbots to Phishbots?: Phishing Scam Generation in Commercial Large Language Models' (https://www.computer.org/csdl/proceedings-article/sp/2024/313000a221/1WPcYLpYFHy).
BibTeX a continuación:
title={From Chatbots to Phishbots?: Phishing Scam Generation in Commercial Large Language Models},
author={Roy, Sayak Saha y Thota, Poojitha y Naragam, Krishna Vamsi y Nilizadeh, Shirin},
booktitle={2024 IEEE Symposium on Security and Privacy (SP)},
pages={221--221},
year={2024},
organization={IEEE Computer Society}
Funcionalidades
- Clasificación de texto
- Utiliza biblioteca Transformers
- Compatible con Safetensors
- Basado en RoBERTa
- Compatible con AutoTrain
- Compatible con Endpoints de Inferencia
Casos de uso
- Identificación de sitios web de phishing
- Detección de correos electrónicos maliciosos
- Clasificación de prompts maliciosos y seguros