zhayunduo/roberta-base-stocktwits-finetuned
zhayunduo
Clasificación de texto
Este modelo está afinado con el modelo roberta-base en 3200000 comentarios de Stocktwits, con las etiquetas asignadas por usuarios 'Alcista' o 'Bajista'. Se recomienda probar algo que los inversores individuales podrían decir en el foro de inversión en la API de inferencia, por ejemplo, probar 'rojo' y 'verde'.
Como usar
from transformers import RobertaForSequenceClassification, RobertaTokenizer
from transformers import pipeline
import pandas as pd
import emoji
# el modelo fue entrenado con la siguiente preprocesamiento
def process_text(texts):
# eliminar URLs
texts = re.sub(r'https?://\S+', '', texts)
texts = re.sub(r'www.\S+', '', texts)
# eliminar '
texts = texts.replace('’', "'")
# eliminar nombres de simbolos
texts = re.sub(r'(\#)(\S+)', r'hashtag_\2', texts)
texts = re.sub(r'(\$)([A-Za-z]+)', r'cashtag_\2', texts)
# eliminar nombres de usuario
texts = re.sub(r'(\@)(\S+)', r'mention_\2', texts)
# desmojizar
texts = emoji.demojize(texts, delimiters=('', ' '))
return texts.strip()
# Cargar el tokenizador y el modelo
tokenizer_loaded = RobertaTokenizer.from_pretrained('zhayunduo/roberta-base-stocktwits-finetuned')
model_loaded = RobertaForSequenceClassification.from_pretrained('zhayunduo/roberta-base-stocktwits-finetuned')
# Crear el pipeline
nlp = pipeline('text-classification', model=model_loaded, tokenizer=tokenizer_loaded)
# Uso de modelo
sentences = pd.Series(['solo compra', 'solo véndelo', '¡cohete entidad al cielo!', 'baja', 'aunque está subiendo, todavía creo que no mantendrá esta tendencia en el futuro cercano'])
# sentences = list(sentences.apply(process_text)) # si el texto de entrada contiene https, @ o # o $ símbolos, es mejor aplicar preprocesamiento para obtener un resultado más preciso
sentences = list(sentences)
results = nlp(sentences)
print(results) # 2 etiquetas, etiqueta 0 es bajista, etiqueta 1 es alcista
Funcionalidades
- Clasificación de texto
- Compatible con Transformers
- Compatible con PyTorch
- Modelado en inglés
- Enfoque en finanzas
- Compatible con AutoTrain
- Compatible con Endpoints de Inferencia
- Licencia Apache-2.0
- Región: US
Casos de uso
- Clasificación de comentarios de bolsa en alcistas o bajistas
- Análisis de sentimiento en foros de inversión
- Herramienta de apoyo para inversores individuales