deberta-v3-base-injection

deepset
Clasificación de texto

Este modelo es una versión ajustada de microsoft/deberta-v3-base en el conjunto de datos de inyección de prompt. Detecta intentos de inyección de prompt y los clasifica como "INJECCIÓN". Las solicitudes legítimas se clasifican como "LEGÍTIMA". El conjunto de datos supone que las solicitudes legítimas son todo tipo de preguntas o búsquedas de palabras clave.

Como usar

Si está utilizando este modelo para asegurar su sistema y es demasiado sensible al clasificar solicitudes como inyecciones, considere recopilar ejemplos legítimos y volver a entrenar el modelo con el conjunto de datos de inyección de prompt.

from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_name = 'deepset/deberta-v3-base-injection'

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Ejemplo de inferencia
inputs = tokenizer("Tu texto aquí", return_tensors="pt")
outputs = model(**inputs)
predictions = torch.argmax(outputs.logits, dim=-1)

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Safetensors
Generado a partir de Trainer
Puntos de inferencia

Casos de uso

Detección de intentos de inyección de prompts
Clasificación de solicitudes como legitimidad vs inyección