distilbart-mnli-github-issues
AntoineMC
Clasificación de texto
Clasificador de problemas de GitHub utilizando clasificación de cero disparos. Este modelo predice si una declaración es una solicitud de función, problema/bug o pregunta. Fue entrenado mediante el método de destilación del clasificador de cero disparos usando el modelo BART-large-mnli como modelo maestro para entrenar un clasificador en problemas de GitHub desde el conjunto de datos Github Issues Prediction.
Como usar
Cómo entrenar usando tu propio conjunto de datos
- Descarga el conjunto de datos de entrenamiento desde https://www.kaggle.com/datasets/anmolkumar/github-bugs-prediction
- Modifica y ejecuta convert.py, actualizando las rutas para convertir a un CSV
- Ejecuta distill.py con el archivo CSV (ver aquí para más información)
Funcionalidades
- Clasificación de texto
- Transformers
- PyTorch
- Clasificación de cero disparos
- NLP
Casos de uso
- Predicción de problemas de GitHub
- Clasificación de solicitudes de características
- Detección de preguntas y problemas en issues de GitHub