roberta-base_topic_classification_nyt_news
dstefa
Clasificación de texto
Este modelo es una versión ajustada de roberta-base en el conjunto de datos NYT News, que contiene 256,000 títulos de noticias de artículos publicados desde el año 2000 hasta el presente. Logra los siguientes resultados en el conjunto de prueba de 51200 casos: Precisión: 0.91, F1: 0.91, Precisión: 0.91, Recuerdo: 0.91.
Como usar
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline
tokenizer = AutoTokenizer.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
model = AutoModelForSequenceClassification.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer)
text = "Kederis proclaims innocence Olympic champion Kostas Kederis today left hospital ahead of his date with IOC inquisitors claiming his innocence and vowing."
pipe(text)
# [{'label': 'Sports', 'score': 0.9989326596260071}]
Funcionalidades
- Clasificación de texto
- Basado en roberta-base de FacebookAI
- Adaptado específicamente para artículos de noticias del New York Times
- Soporta múltiples categorías: Deportes, Arte, Cultura y Entretenimiento, Negocios y Finanzas, Salud y Bienestar, Estilo de Vida y Moda, Ciencia y Tecnología, Política, Crimen
- Resultados de rendimiento altos con una precisión y métricas F1 de 0.91
Casos de uso
- Clasificación de artículos de noticias según temas
- Análisis de sentimientos en artículos de noticias
- Organización automática de grandes volúmenes de contenido noticioso
- Ayuda en la curación de contenido para plataformas de medios