KevSun/Personality_LM
En este proyecto, hemos refinado las capacidades de un modelo preexistente para evaluar los cinco grandes rasgos de la personalidad a partir de un texto o una oración. Al ajustar minuciosamente este modelo utilizando un conjunto de datos especialmente curado y adaptado para los rasgos de personalidad, ha aprendido a correlacionar entradas textuales específicas con características de personalidad distintas. Este enfoque específico ha mejorado significativamente la precisión del modelo en la identificación de los cinco grandes rasgos de la personalidad a partir del texto, superando a otros modelos que fueron desarrollados o ajustados en conjuntos de datos más generalizados. La precisión alcanza el 80%, y la puntuación F1 es del 79%. Ambos son mucho más altos que los modelos similares de detección de personalidad alojados en HuggingFace. En otras palabras, nuestro modelo supera notablemente a otros modelos. Debido al hecho de que los valores de salida son continuos, es mejor usar errores cuadrados medios (MSE) o error medio absoluto (MAE) para evaluar el rendimiento del modelo. Cuando ambas métricas son menores, esto indica que el modelo rinde mejor. El rendimiento de nuestro modelo: MSE: 0.07, MAE: 0.14.
Como usar
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch
warnings.filterwarnings('ignore')
model = AutoModelForSequenceClassification.from_pretrained('KevSun/Personality_LM', ignore_mismatched_sizes=True)
tokenizer = AutoTokenizer.from_pretrained('KevSun/Personality_LM')
# Elija entre entrada de texto directa o entrada de archivo
use_file = False # Cambiar a True si desea leer desde un archivo
if use_file:
file_path = 'path/to/your/textfile.txt' # Reemplace con la ruta de su archivo
with open(file_path, 'r', encoding='utf-8') as file:
new_text = file.read()
else:
new_text = 'President Joe Biden dijo el miércoles que se retiraba de la carrera contra el republicano Donald Trump por preocupaciones sobre el futuro de la democracia estadounidense, explicando que se hacía a un lado para permitir que una nueva generación tomase el relevo en sus primeras declaraciones públicas desde el fin de su candidatura a la reelección. En un discurso en el Despacho Oval, Biden invocó a presidentes anteriores como Thomas Jefferson, George Washington y Abraham Lincoln al describir su amor por el cargo que dejará en seis meses, culminando una media siglo en el servicio público.'
# Codifique el texto utilizando el mismo tokenizador usado durante el entrenamiento
encoded_input = tokenizer(new_text, return_tensors='pt', padding=True, truncation=True, max_length=64)
model.eval() # Configurar el modelo en modo evaluación
# Realizar la predicción
with torch.no_grad():
outputs = model(**encoded_input)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
predicted_scores = predictions[0].tolist()
trait_names = ['amabilidad', 'apertura', 'escrupulosidad', 'extraversión', 'neuroticismo']
for trait, score in zip(trait_names, predicted_scores):
print(f'{trait}: {score:.4f}')
Funcionalidades
- Clasificación de texto
- Transformers
- Compatibilidad con PyTorch
- Compatibilidad con AutoTrain
- Compatibilidad con Puntos de Inferencia
- Basado en el modelo roberta
Casos de uso
- Detección de rasgos de personalidad a partir de texto
- Evaluación de los cinco grandes rasgos de la personalidad para aplicaciones de psicología y recursos humanos