distilroberta-finetuned-financial-text-classification
Este modelo es una versión afinada de distilroberta-base en el conjunto de datos sentence_50Agree financial-phrasebank + Kaggle Dataset, un conjunto de datos que consta de 4840 noticias financieras categorizadas por sentimiento (negativo, neutral, positivo). El conjunto de datos de Kaggle incluye datos de sentimiento sobre Covid-19 y se puede encontrar aquí: sentiment-classification-selflabel-dataset. El modelo determina el sentimiento financiero del texto dado. Dada la distribución desequilibrada de las etiquetas de clase, los pesos se ajustaron para prestar atención a las etiquetas menos muestreadas, lo que debería aumentar el rendimiento general. El conjunto de datos Covid se agregó para enriquecer el modelo, ya que la mayoría de los modelos no han sido entrenados en el impacto de Covid-19 en las ganancias o mercados.
Como usar
from transformers import RobertaTokenizer, RobertaForSequenceClassification
import torch
# Cargar el modelo y el tokenizador
model_name = 'distilroberta-finetuned-financial-text-classification'
tokenizer = RobertaTokenizer.from_pretrained(model_name)
model = RobertaForSequenceClassification.from_pretrained(model_name)
# Ejemplo de texto
text = "El USD ganó un 10% anoche"
inputs = tokenizer(text, return_tensors='pt')
outputs = model(**inputs)
logits = outputs.logits
# Predicción del sentimiento
predicted_class = torch.argmax(logits, dim=1).item()
print(f"Sentimiento predicho: {predicted_class}")
Funcionalidades
- Clasificación de texto
- Análisis de sentimiento financiero
- Modelo base: distilroberta-base
- Afinado en conjuntos de datos financieros
- Incluye datos de Covid-19
Casos de uso
- Detección de sentimiento en noticias financieras
- Análisis del impacto de Covid-19 en las ganancias del mercado
- Mejorar modelos financieros entrenados con datos históricos
- Análisis de tendencias financieras