distilroberta-finetuned-financial-text-classification

nickmuchi

Clasificación de texto

Este modelo es una versión afinada de distilroberta-base en el conjunto de datos sentence_50Agree financial-phrasebank + Kaggle Dataset, un conjunto de datos que consta de 4840 noticias financieras categorizadas por sentimiento (negativo, neutral, positivo). El conjunto de datos de Kaggle incluye datos de sentimiento sobre Covid-19 y se puede encontrar aquí: sentiment-classification-selflabel-dataset. El modelo determina el sentimiento financiero del texto dado. Dada la distribución desequilibrada de las etiquetas de clase, los pesos se ajustaron para prestar atención a las etiquetas menos muestreadas, lo que debería aumentar el rendimiento general. El conjunto de datos Covid se agregó para enriquecer el modelo, ya que la mayoría de los modelos no han sido entrenados en el impacto de Covid-19 en las ganancias o mercados.

Como usar

from transformers import RobertaTokenizer, RobertaForSequenceClassification
import torch

# Cargar el modelo y el tokenizador
model_name = 'distilroberta-finetuned-financial-text-classification'
tokenizer = RobertaTokenizer.from_pretrained(model_name)
model = RobertaForSequenceClassification.from_pretrained(model_name)

# Ejemplo de texto
text = "El USD ganó un 10% anoche"
inputs = tokenizer(text, return_tensors='pt')
outputs = model(**inputs)
logits = outputs.logits

# Predicción del sentimiento
predicted_class = torch.argmax(logits, dim=1).item()
print(f"Sentimiento predicho: {predicted_class}")

Funcionalidades

Clasificación de texto
Análisis de sentimiento financiero
Modelo base: distilroberta-base
Afinado en conjuntos de datos financieros
Incluye datos de Covid-19

Casos de uso

Detección de sentimiento en noticias financieras
Análisis del impacto de Covid-19 en las ganancias del mercado
Mejorar modelos financieros entrenados con datos históricos
Análisis de tendencias financieras