sec-bert-finetuned-finance-classification
nickmuchi
Clasificación de texto
Este modelo es una versión ajustada de nlpaueb/sec-bert-base en el dataset sentence_50Agree financial-phrasebank + Kaggle, un conjunto de datos que consta de 4840 noticias financieras categorizadas por sentimiento (negativo, neutral, positivo). El dataset de Kaggle incluye datos de sentimiento sobre Covid-19 y puede encontrarse aquí: sentiment-classification-selflabel-dataset. El modelo alcanza los siguientes resultados en el conjunto de evaluación: Pérdida: 0.5277, Precisión: 0.8755, F1: 0.8744, Precisión (Precision): 0.8754, Recuerdo (Recall): 0.8755.
Como usar
Hiperparámetros de Entrenamiento
Se utilizaron los siguientes hiperparámetros durante el entrenamiento:
learning_rate: 2e-05
train_batch_size: 64
eval_batch_size: 64
seed: 42
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 8
mixed_precision_training: Native AMP
Resultados del Entrenamiento
Pérdida de Entrenamiento
Época
Paso
Pérdida de Validación
Precisión
F1
Precisión (Precision)
Recuerdo (Recall)
0.6005
0.99
71
0.3702
0.8478
0.8465
0.8491
0.8478
0.3226
1.97
142
0.3172
0.8834
0.8822
0.8861
0.8834
0.2299
2.96
213
0.3313
0.8814
0.8805
0.8821
0.8814
0.1277
3.94
284
0.3925
0.8775
0.8771
0.8770
0.8775
0.0764
4.93
355
0.4517
0.8715
0.8704
0.8717
0.8715
0.0533
5.92
426
0.4851
0.8735
0.8728
0.8731
0.8735
0.0363
6.90
497
0.5107
0.8755
0.8743
0.8757
0.8755
0.0248
7.89
568
0.5277
0.8755
0.8744
0.8754
0.8755
Versiones del Framework
Transformers 4.17.0
Pytorch 1.10.0+cu111
Datasets 1.18.4
Tokenizers 0.11.6
Funcionalidades
- Clasificación de texto
- Transformadores (Transformers)
- PyTorch
- TensorBoard
- ONNX
- Análisis de sentimientos financieros
- Generación a partir de Trainer
Casos de uso
- Análisis de sentimiento en noticias financieras
- Clasificación de texto financiero
- Evaluación del impacto del Covid-19 en la percepción financiera