zhayunduo/roberta-base-stocktwits-finetuned

zhayunduo
Clasificación de texto

Este modelo está afinado con el modelo roberta-base en 3200000 comentarios de Stocktwits, con las etiquetas asignadas por usuarios 'Alcista' o 'Bajista'. Se recomienda probar algo que los inversores individuales podrían decir en el foro de inversión en la API de inferencia, por ejemplo, probar 'rojo' y 'verde'.

Como usar

from transformers import RobertaForSequenceClassification, RobertaTokenizer
from transformers import pipeline
import pandas as pd
import emoji

# el modelo fue entrenado con la siguiente preprocesamiento

def process_text(texts):
    # eliminar URLs
    texts = re.sub(r'https?://\S+', '', texts)
    texts = re.sub(r'www.\S+', '', texts)
    # eliminar ' 
    texts = texts.replace('’', "'")
    # eliminar nombres de simbolos
    texts = re.sub(r'(\#)(\S+)', r'hashtag_\2', texts)
    texts = re.sub(r'(\$)([A-Za-z]+)', r'cashtag_\2', texts)
    # eliminar nombres de usuario
    texts = re.sub(r'(\@)(\S+)', r'mention_\2', texts)
    # desmojizar
    texts = emoji.demojize(texts, delimiters=('', ' '))
    return texts.strip()


# Cargar el tokenizador y el modelo

tokenizer_loaded = RobertaTokenizer.from_pretrained('zhayunduo/roberta-base-stocktwits-finetuned')
model_loaded = RobertaForSequenceClassification.from_pretrained('zhayunduo/roberta-base-stocktwits-finetuned')

# Crear el pipeline

nlp = pipeline('text-classification', model=model_loaded, tokenizer=tokenizer_loaded)

# Uso de modelo

sentences = pd.Series(['solo compra', 'solo véndelo', '¡cohete entidad al cielo!', 'baja', 'aunque está subiendo, todavía creo que no mantendrá esta tendencia en el futuro cercano'])
# sentences = list(sentences.apply(process_text))  # si el texto de entrada contiene https, @ o # o $ símbolos, es mejor aplicar preprocesamiento para obtener un resultado más preciso
sentences = list(sentences)
results = nlp(sentences)
print(results)  # 2 etiquetas, etiqueta 0 es bajista, etiqueta 1 es alcista

Funcionalidades

Clasificación de texto
Compatible con Transformers
Compatible con PyTorch
Modelado en inglés
Enfoque en finanzas
Compatible con AutoTrain
Compatible con Endpoints de Inferencia
Licencia Apache-2.0
Región: US

Casos de uso

Clasificación de comentarios de bolsa en alcistas o bajistas
Análisis de sentimiento en foros de inversión
Herramienta de apoyo para inversores individuales