ReasonEval-7B

GAIR

Clasificación de texto

ReasonEval-7B es un modelo de lenguaje de solo decodificación con 7 mil millones de parámetros afinado a partir de WizardMath-7B-V1.1. Dado un problema matemático y la solución, ReasonEval-7B evalúa el proceso de resolución de problemas en un formato paso a paso desde las siguientes perspectivas: Validez: El paso no contiene errores en el cálculo y la lógica. Redundancia: El paso carece de utilidad para resolver el problema pero sigue siendo válido.

Como usar

Para obtener instrucciones detalladas sobre cómo usar el modelo ReasonEval-7B, visite nuestro repositorio de GitHub en https://github.com/GAIR-NLP/ReasonEval.

Funcionalidades

Cuantificar la calidad de los pasos de razonamiento sin modelos humanos o de código cerrado.
Encontrar los posibles pasos inválidos o redundantes en las soluciones, incluso con los resultados correctos.
Seleccionar datos de entrenamiento de alta calidad para tareas de aguas abajo (por ejemplo, ajuste fino).

Casos de uso

Evaluación de la calidad de los pasos de razonamiento
Identificación de pasos inválidos o redundantes en soluciones matemáticas
Selección de datos de entrenamiento de alta calidad para tareas posteriores