sfairXC/FsfairX-Gemma2-RM-v0.1

sfairXC

Clasificación de texto

Este es un modelo de recompensa basado en Vanilla BT basado en Gemma-2-9B. Las recetas son del flujo de trabajo de RLHF. Los resultados del banco de recompensas son los siguientes: Chat: 98.04, Chat Difícil: 65.35, Seguridad: 89.54, Razonamiento: 92.31.

Como usar

Este modelo se utiliza principalmente para clasificación de texto basada en recompensas. Aquí está un ejemplo de uso del modelo:
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model = AutoModelForSequenceClassification.from_pretrained('sfairXC/FsfairX-Gemma2-RM-v0.1')
tokenizer = AutoTokenizer.from_pretrained('sfairXC/FsfairX-Gemma2-RM-v0.1')

inputs = tokenizer('I like you. I love you', return_tensors='pt')
outputs = model(**inputs)

Funcionalidades

Clasificación de texto
Compatibilidad con AutoTrain
Inferencia de generación de texto
Compatibilidad con puntos de inferencia
Transformadores
Safetensors
Region: US

Casos de uso

Clasificación y categorización de textos.
Evaluación y clasificación de la calidad de las conversaciones.
Modelado de recompensas para flujos de trabajo de RLHF (Reforzamiento basado en retroalimentación humana robusta)
Análisis y evolución de la seguridad en intercambios conversacionales.
Razonamiento natural y evaluaciones semánticas.