Clasificador de discurso de odio para contenido en redes sociales en inglés
IMSyPP
Clasificación de texto
Un modelo monolingüe para la clasificación de discurso de odio en contenido de redes sociales en inglés. El modelo fue entrenado con 103,190 comentarios de YouTube y probado en un conjunto de prueba independiente de 20,554 comentarios de YouTube. Se basa en el modelo preentrenado de lenguaje BERT base en inglés.
Como usar
Durante el entrenamiento, el texto fue preprocesado utilizando el tokenizador original de BERT base en inglés. Sugerimos que se utilice el mismo tokenizador para la inferencia. El modelo clasifica cada entrada en una de las cuatro clases distintas:
0 - aceptable
1 - inapropiado
2 - ofensivo
3 - violento
Funcionalidades
- Clasificación de texto
- Basado en Transformers
- Entrenado con PyTorch
- Clasificación en cuatro clases distintas
Casos de uso
- Clasificación de comentarios en redes sociales
- Detección de discurso de odio en plataformas de medios sociales