ReasonEval-7B
GAIR
Clasificación de texto
ReasonEval-7B es un modelo de lenguaje de solo decodificación con 7 mil millones de parámetros afinado a partir de WizardMath-7B-V1.1. Dado un problema matemático y la solución, ReasonEval-7B evalúa el proceso de resolución de problemas en un formato paso a paso desde las siguientes perspectivas: Validez: El paso no contiene errores en el cálculo y la lógica. Redundancia: El paso carece de utilidad para resolver el problema pero sigue siendo válido.
Como usar
Para obtener instrucciones detalladas sobre cómo usar el modelo ReasonEval-7B, visite nuestro repositorio de GitHub en https://github.com/GAIR-NLP/ReasonEval.
Funcionalidades
- Cuantificar la calidad de los pasos de razonamiento sin modelos humanos o de código cerrado.
- Encontrar los posibles pasos inválidos o redundantes en las soluciones, incluso con los resultados correctos.
- Seleccionar datos de entrenamiento de alta calidad para tareas de aguas abajo (por ejemplo, ajuste fino).
Casos de uso
- Evaluación de la calidad de los pasos de razonamiento
- Identificación de pasos inválidos o redundantes en soluciones matemáticas
- Selección de datos de entrenamiento de alta calidad para tareas posteriores