Clasificador de discurso de odio para contenido en redes sociales en inglés

IMSyPP

Clasificación de texto

Un modelo monolingüe para la clasificación de discurso de odio en contenido de redes sociales en inglés. El modelo fue entrenado con 103,190 comentarios de YouTube y probado en un conjunto de prueba independiente de 20,554 comentarios de YouTube. Se basa en el modelo preentrenado de lenguaje BERT base en inglés.

Como usar

Durante el entrenamiento, el texto fue preprocesado utilizando el tokenizador original de BERT base en inglés. Sugerimos que se utilice el mismo tokenizador para la inferencia. El modelo clasifica cada entrada en una de las cuatro clases distintas:
0 - aceptable
1 - inapropiado
2 - ofensivo
3 - violento

Funcionalidades

Clasificación de texto
Basado en Transformers
Entrenado con PyTorch
Clasificación en cuatro clases distintas

Casos de uso

Clasificación de comentarios en redes sociales
Detección de discurso de odio en plataformas de medios sociales