roberta-base_topic_classification_nyt_news

dstefa

Clasificación de texto

Este modelo es una versión ajustada de roberta-base en el conjunto de datos NYT News, que contiene 256,000 títulos de noticias de artículos publicados desde el año 2000 hasta el presente. Logra los siguientes resultados en el conjunto de prueba de 51200 casos: Precisión: 0.91, F1: 0.91, Precisión: 0.91, Recuerdo: 0.91.

Como usar

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
model = AutoModelForSequenceClassification.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer)

text = "Kederis proclaims innocence Olympic champion Kostas Kederis today left hospital ahead of his date with IOC inquisitors claiming his innocence and vowing."
pipe(text)

# [{'label': 'Sports', 'score': 0.9989326596260071}]

Funcionalidades

Clasificación de texto
Basado en roberta-base de FacebookAI
Adaptado específicamente para artículos de noticias del New York Times
Soporta múltiples categorías: Deportes, Arte, Cultura y Entretenimiento, Negocios y Finanzas, Salud y Bienestar, Estilo de Vida y Moda, Ciencia y Tecnología, Política, Crimen
Resultados de rendimiento altos con una precisión y métricas F1 de 0.91

Casos de uso

Clasificación de artículos de noticias según temas
Análisis de sentimientos en artículos de noticias
Organización automática de grandes volúmenes de contenido noticioso
Ayuda en la curación de contenido para plataformas de medios