sec-bert-finetuned-finance-classification

nickmuchi

Clasificación de texto

Este modelo es una versión ajustada de nlpaueb/sec-bert-base en el dataset sentence_50Agree financial-phrasebank + Kaggle, un conjunto de datos que consta de 4840 noticias financieras categorizadas por sentimiento (negativo, neutral, positivo). El dataset de Kaggle incluye datos de sentimiento sobre Covid-19 y puede encontrarse aquí: sentiment-classification-selflabel-dataset. El modelo alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.5277, Precisión: 0.8755, F1: 0.8744, Precisión (Precision): 0.8754, Recuerdo (Recall): 0.8755.

Como usar

Hiperparámetros de Entrenamiento
Se utilizaron los siguientes hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 64
eval_batch_size: 64
seed: 42
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 8
mixed_precision_training: Native AMP

Resultados del Entrenamiento
Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión
F1
Precisión (Precision)
Recuerdo (Recall)

0.6005
0.99
71
0.3702
0.8478
0.8465
0.8491
0.8478

0.3226
1.97
142
0.3172
0.8834
0.8822
0.8861
0.8834

0.2299
2.96
213
0.3313
0.8814
0.8805
0.8821
0.8814

0.1277
3.94
284
0.3925
0.8775
0.8771
0.8770
0.8775

0.0764
4.93
355
0.4517
0.8715
0.8704
0.8717
0.8715

0.0533
5.92
426
0.4851
0.8735
0.8728
0.8731
0.8735

0.0363
6.90
497
0.5107
0.8755
0.8743
0.8757
0.8755

0.0248
7.89
568
0.5277
0.8755
0.8744
0.8754
0.8755

Versiones del Framework
Transformers 4.17.0
Pytorch 1.10.0+cu111
Datasets 1.18.4
Tokenizers 0.11.6

Funcionalidades

Clasificación de texto
Transformadores (Transformers)
PyTorch
TensorBoard
ONNX
Análisis de sentimientos financieros
Generación a partir de Trainer

Casos de uso

Análisis de sentimiento en noticias financieras
Clasificación de texto financiero
Evaluación del impacto del Covid-19 en la percepción financiera