sfairXC/FsfairX-Gemma2-RM-v0.1
sfairXC
Clasificación de texto
Este es un modelo de recompensa basado en Vanilla BT basado en Gemma-2-9B. Las recetas son del flujo de trabajo de RLHF. Los resultados del banco de recompensas son los siguientes: Chat: 98.04, Chat Difícil: 65.35, Seguridad: 89.54, Razonamiento: 92.31.
Como usar
Este modelo se utiliza principalmente para clasificación de texto basada en recompensas. Aquí está un ejemplo de uso del modelo:
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model = AutoModelForSequenceClassification.from_pretrained('sfairXC/FsfairX-Gemma2-RM-v0.1')
tokenizer = AutoTokenizer.from_pretrained('sfairXC/FsfairX-Gemma2-RM-v0.1')
inputs = tokenizer('I like you. I love you', return_tensors='pt')
outputs = model(**inputs)
Funcionalidades
- Clasificación de texto
- Compatibilidad con AutoTrain
- Inferencia de generación de texto
- Compatibilidad con puntos de inferencia
- Transformadores
- Safetensors
- Region: US
Casos de uso
- Clasificación y categorización de textos.
- Evaluación y clasificación de la calidad de las conversaciones.
- Modelado de recompensas para flujos de trabajo de RLHF (Reforzamiento basado en retroalimentación humana robusta)
- Análisis y evolución de la seguridad en intercambios conversacionales.
- Razonamiento natural y evaluaciones semánticas.