deberta-v3-base-injection
deepset
Clasificación de texto
Este modelo es una versión ajustada de microsoft/deberta-v3-base en el conjunto de datos de inyección de prompt. Detecta intentos de inyección de prompt y los clasifica como "INJECCIÓN". Las solicitudes legítimas se clasifican como "LEGÍTIMA". El conjunto de datos supone que las solicitudes legítimas son todo tipo de preguntas o búsquedas de palabras clave.
Como usar
Si está utilizando este modelo para asegurar su sistema y es demasiado sensible al clasificar solicitudes como inyecciones, considere recopilar ejemplos legítimos y volver a entrenar el modelo con el conjunto de datos de inyección de prompt.
from transformers import AutoTokenizer, AutoModelForSequenceClassification
model_name = 'deepset/deberta-v3-base-injection'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
# Ejemplo de inferencia
inputs = tokenizer("Tu texto aquí", return_tensors="pt")
outputs = model(**inputs)
predictions = torch.argmax(outputs.logits, dim=-1)
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Safetensors
- Generado a partir de Trainer
- Puntos de inferencia
Casos de uso
- Detección de intentos de inyección de prompts
- Clasificación de solicitudes como legitimidad vs inyección