leondz/refutation_detector_distilbert

leondz

Clasificación de texto

Estas son respuestas diseñadas para capturar un modelo que refuta una afirmación falsa. Son resultados de indicaciones del modelo OpenAI gpt-3.5-turbo ejecutados el 1 de junio de 2023. Las indicaciones se construyen anteponiendo 'Explica por qué' a las afirmaciones realizadas en el conjunto de datos True-False provisto junto con The Internal State of an LLM Knows When its Lying. Solo se incluye la primera oración de la respuesta (de nltk.sent_tokenize). Se utilizan las etiquetas originales, donde 0 corresponde a una afirmación falsa. Es decir, las etiquetas 0 deberían ser casi todas refutaciones. Las refutaciones espurias y faltantes fueron eliminadas a mano, correspondiendo al 10% de los datos. Esto fue causado por una afirmación incorrecta del modelo o errores en los datos de origen.

Como usar

Este modelo aún no tiene suficiente actividad para ser desplegado en la API de inferencia (sin servidor). Aumenta su visibilidad social y vuelve a verificarlo más tarde, o despliega a Endpoints de Inferencia (dedicados) en su lugar.

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Safetensors
Distilbert
Endpoints de inferencia

Casos de uso

Refutación de afirmaciones falsas
Análisis de la veracidad de las afirmaciones en conjuntos de datos