sec-bert-finetuned-finance-classification

nickmuchi
Clasificación de texto

Este modelo es una versión ajustada de nlpaueb/sec-bert-base en el dataset sentence_50Agree financial-phrasebank + Kaggle, un conjunto de datos que consta de 4840 noticias financieras categorizadas por sentimiento (negativo, neutral, positivo). El dataset de Kaggle incluye datos de sentimiento sobre Covid-19 y puede encontrarse aquí: sentiment-classification-selflabel-dataset. El modelo alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.5277, Precisión: 0.8755, F1: 0.8744, Precisión (Precision): 0.8754, Recuerdo (Recall): 0.8755.

Como usar

Hiperparámetros de Entrenamiento

Se utilizaron los siguientes hiperparámetros durante el entrenamiento:

learning_rate: 2e-05
train_batch_size: 64
eval_batch_size: 64
seed: 42
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 8
mixed_precision_training: Native AMP

Resultados del Entrenamiento

Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión
F1
Precisión (Precision)
Recuerdo (Recall)

0.6005
0.99
71
0.3702
0.8478
0.8465
0.8491
0.8478

0.3226
1.97
142
0.3172
0.8834
0.8822
0.8861
0.8834

0.2299
2.96
213
0.3313
0.8814
0.8805
0.8821
0.8814

0.1277
3.94
284
0.3925
0.8775
0.8771
0.8770
0.8775

0.0764
4.93
355
0.4517
0.8715
0.8704
0.8717
0.8715

0.0533
5.92
426
0.4851
0.8735
0.8728
0.8731
0.8735

0.0363
6.90
497
0.5107
0.8755
0.8743
0.8757
0.8755

0.0248
7.89
568
0.5277
0.8755
0.8744
0.8754
0.8755

Versiones del Framework

Transformers 4.17.0
Pytorch 1.10.0+cu111
Datasets 1.18.4
Tokenizers 0.11.6

Funcionalidades

Clasificación de texto
Transformadores (Transformers)
PyTorch
TensorBoard
ONNX
Análisis de sentimientos financieros
Generación a partir de Trainer

Casos de uso

Análisis de sentimiento en noticias financieras
Clasificación de texto financiero
Evaluación del impacto del Covid-19 en la percepción financiera