dima806/news-category-classifier-distilbert
dima806
Clasificación de texto
Este modelo devuelve la categoría de una noticia dada un texto. Para más detalles, consulte https://www.kaggle.com/code/dima806/news-category-classification-distilbert. Este modelo utiliza la arquitectura DistilBERT y está diseñado para clasificación de textos. Ha sido entrenado utilizando PyTorch y Safetensors, y bajo la licencia Apache 2.0.
Como usar
Para usar este modelo, puede consultar el reporte de clasificación:
precision recall f1-score support
ARTS 0.4985 0.5629 0.5288 302
ARTS & CULTURE 0.5061 0.4627 0.4834 268
BLACK VOICES 0.5903 0.4776 0.5280 917
BUSINESS 0.6136 0.5659 0.5888 1198
COLLEGE 0.5043 0.5066 0.5054 229
COMEDY 0.5990 0.5630 0.5804 1080
CRIME 0.6365 0.6615 0.6488 712
CULTURE & ARTS 0.7133 0.4744 0.5698 215
DIVORCE 0.8498 0.8015 0.8249 685
EDUCATION 0.5000 0.5025 0.5012 203
ENTERTAINMENT 0.7383 0.8146 0.7745 3473
ENVIRONMENT 0.5490 0.5433 0.5461 289
FIFTY 0.6107 0.3250 0.4242 280
FOOD & DRINK 0.7514 0.8320 0.7897 1268
GOOD NEWS 0.4676 0.2321 0.3103 280
GREEN 0.4685 0.5401 0.5018 524
HEALTHY LIVING 0.5669 0.4712 0.5147 1339
HOME & LIVING 0.8267 0.8113 0.8189 864
IMPACT 0.5000 0.3702 0.4254 697
LATINO VOICES 0.6066 0.5664 0.5858 226
MEDIA 0.6136 0.5688 0.5903 589
MONEY 0.6193 0.5840 0.6012 351
PARENTING 0.6711 0.7673 0.7160 1758
PARENTS 0.5094 0.4475 0.4764 791
POLITICS 0.8154 0.8365 0.8258 7120
QUEER VOICES 0.7949 0.7392 0.7660 1269
RELIGION 0.6681 0.6097 0.6376 515
SCIENCE 0.6370 0.6327 0.6348 441
SPORTS 0.7628 0.8079 0.7847 1015
STYLE 0.6343 0.6231 0.6286 451
STYLE & BEAUTY 0.8656 0.8894 0.8773 1962
TASTE 0.4701 0.4320 0.4502 419
TECH 0.6188 0.5952 0.6068 420
THE WORLDPOST 0.5786 0.5825 0.5806 733
TRAVEL 0.8501 0.8596 0.8548 1980
U.S. NEWS 0.4256 0.3018 0.3532 275
WEDDINGS 0.8320 0.8810 0.8558 731
WEIRD NEWS 0.5030 0.4559 0.4783 555
WELLNESS 0.7272 0.8459 0.7821 3589
WOMEN 0.4841 0.4062 0.4417 714
WORLD NEWS 0.4936 0.4682 0.4806 660
WORLDPOST 0.6840 0.6376 0.6600 516
accuracy 0.7073 41903
macro avg 0.6275 0.5966 0.6080 41903
weighted avg 0.7007 0.7073 0.7017 41903
Funcionalidades
- Clasificación de texto
- Basado en Transformers
- Entrenado con PyTorch
- Compatible con Safetensors
- Precisión promedio: 0.6275
- Cobertura promedio: 0.5966
- Puntuación f1 promedio: 0.6080
Casos de uso
- Clasificación de artículos de noticias en categorías predefinidas
- Análisis de contenido para medios de comunicación
- Filtrado y organización de noticias en plataformas digitales