Python-Edu Scorer

HuggingFaceTB

Clasificación de texto

Este modelo es una versión afinada de Snowflake/snowflake-arctic-embed-m en un conjunto de datos de archivos Python etiquetados por Llama3 para su valor educativo. Utilizamos este clasificador para construir el conjunto de datos Python-Edu.

Como usar

Para cargar el clasificador Python-Edu, use el siguiente código:
from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/python-edu-scorer")
model = AutoModelForSequenceClassification.from_pretrained("HuggingFaceTB/python-edu-scorer")

text = "This is a test sentence."
inputs = tokenizer(text, return_tensors="pt", padding="longest", truncation=True)
outputs = model(**inputs)
logits = outputs.logits.squeeze(-1).float().detach().numpy()
score = logits.item()
result = {
"text": text,
 "score": score,
 "int_score": int(round(max(0, min(score, 5)))),
}

print(result)
# {'text': 'This is a test sentence.', 'score': 0.07964489609003067, 'int_score': 0}

Funcionalidades

Clasificación de texto
Transformers
Safetensors
bert
Generado a partir de Trainer
Puntos finales de inferencia

Casos de uso

Evaluar archivos de código Python para determinar su calidad educativa.
Construir conjuntos de datos de archivos Python clasificados por su valor educativo.
Ayudar a principiantes a identificar archivos de código útiles para aprender Python.