distilbart-mnli-github-issues

AntoineMC
Clasificación de texto

Clasificador de problemas de GitHub utilizando clasificación de cero disparos. Este modelo predice si una declaración es una solicitud de función, problema/bug o pregunta. Fue entrenado mediante el método de destilación del clasificador de cero disparos usando el modelo BART-large-mnli como modelo maestro para entrenar un clasificador en problemas de GitHub desde el conjunto de datos Github Issues Prediction.

Como usar

Cómo entrenar usando tu propio conjunto de datos

  1. Descarga el conjunto de datos de entrenamiento desde https://www.kaggle.com/datasets/anmolkumar/github-bugs-prediction
  2. Modifica y ejecuta convert.py, actualizando las rutas para convertir a un CSV
  3. Ejecuta distill.py con el archivo CSV (ver aquí para más información)

Funcionalidades

Clasificación de texto
Transformers
PyTorch
Clasificación de cero disparos
NLP

Casos de uso

Predicción de problemas de GitHub
Clasificación de solicitudes de características
Detección de preguntas y problemas en issues de GitHub