KevSun/Personality_LM

KevSun

Clasificación de texto

En este proyecto, hemos refinado las capacidades de un modelo preexistente para evaluar los cinco grandes rasgos de la personalidad a partir de un texto o una oración. Al ajustar minuciosamente este modelo utilizando un conjunto de datos especialmente curado y adaptado para los rasgos de personalidad, ha aprendido a correlacionar entradas textuales específicas con características de personalidad distintas. Este enfoque específico ha mejorado significativamente la precisión del modelo en la identificación de los cinco grandes rasgos de la personalidad a partir del texto, superando a otros modelos que fueron desarrollados o ajustados en conjuntos de datos más generalizados. La precisión alcanza el 80%, y la puntuación F1 es del 79%. Ambos son mucho más altos que los modelos similares de detección de personalidad alojados en HuggingFace. En otras palabras, nuestro modelo supera notablemente a otros modelos. Debido al hecho de que los valores de salida son continuos, es mejor usar errores cuadrados medios (MSE) o error medio absoluto (MAE) para evaluar el rendimiento del modelo. Cuando ambas métricas son menores, esto indica que el modelo rinde mejor. El rendimiento de nuestro modelo: MSE: 0.07, MAE: 0.14.

Como usar

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

warnings.filterwarnings('ignore')
model = AutoModelForSequenceClassification.from_pretrained('KevSun/Personality_LM', ignore_mismatched_sizes=True)
tokenizer = AutoTokenizer.from_pretrained('KevSun/Personality_LM')

# Elija entre entrada de texto directa o entrada de archivo
use_file = False # Cambiar a True si desea leer desde un archivo

if use_file:
    file_path = 'path/to/your/textfile.txt' # Reemplace con la ruta de su archivo
    with open(file_path, 'r', encoding='utf-8') as file:
        new_text = file.read()
else:
    new_text = 'President Joe Biden dijo el miércoles que se retiraba de la carrera contra el republicano Donald Trump por preocupaciones sobre el futuro de la democracia estadounidense, explicando que se hacía a un lado para permitir que una nueva generación tomase el relevo en sus primeras declaraciones públicas desde el fin de su candidatura a la reelección. En un discurso en el Despacho Oval, Biden invocó a presidentes anteriores como Thomas Jefferson, George Washington y Abraham Lincoln al describir su amor por el cargo que dejará en seis meses, culminando una media siglo en el servicio público.'

# Codifique el texto utilizando el mismo tokenizador usado durante el entrenamiento
encoded_input = tokenizer(new_text, return_tensors='pt', padding=True, truncation=True, max_length=64)

model.eval() # Configurar el modelo en modo evaluación

# Realizar la predicción
with torch.no_grad():
    outputs = model(**encoded_input)

predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
predicted_scores = predictions[0].tolist()

trait_names = ['amabilidad', 'apertura', 'escrupulosidad', 'extraversión', 'neuroticismo']

for trait, score in zip(trait_names, predicted_scores):
    print(f'{trait}: {score:.4f}')

Funcionalidades

Clasificación de texto
Transformers
Compatibilidad con PyTorch
Compatibilidad con AutoTrain
Compatibilidad con Puntos de Inferencia
Basado en el modelo roberta

Casos de uso

Detección de rasgos de personalidad a partir de texto
Evaluación de los cinco grandes rasgos de la personalidad para aplicaciones de psicología y recursos humanos