hebert-finetuned-hebrew-squad

tdklab
Pregunta y respuesta

Este modelo afina el modelo avichr/heBERT en el conjunto de datos SQuAD auto-traducido al hebreo. Fue creado por Matan Ben-chorin y May Flaster, guiados por el Dr. Oren Mishali, como su proyecto final de estudios en la Facultad de Ingeniería Eléctrica combinada con Ciencias de la Computación en el Technion, Instituto de Tecnología de Israel. Este modelo utiliza el conjunto de datos Hebrew_Squad_v1 para su entrenamiento.

Como usar

from transformers import pipeline

model_checkpoint = "tdklab/hebert-finetuned-hebrew-squad"
qa_pipeline = pipeline(
"question-answering",
model=model_checkpoint, 
)

predictions = qa_pipeline({
'context': "ירושלים היא עיר הבירה של מדינת ישראל , והעיר הגדולה ביותר בישראל בגודל האוכלוסייה. נכון לשנת 2021, מתגוררים בה כ-957 אלף תושבים. בירושלים שוכנים מוסדות הממשל של ישראל: הכנסת, בית המשפט העליון, משכן הנשיא, בית ראש הממשלה ורוב משרדי הממשלה. ירושלים שוכנת בהרי יהודה, על קו פרשת המים הארצי של ארץ ישראל, בין הים התיכון וים המלח, ברום של 570 עד 857 מטרים מעל פני הים.",'question': "מהי עיר הבירה של מדינת ישראל?"
})

print(predictions)
# output:
# {'score': 0.9999890327453613, 'start': 0, 'end': 7, 'answer': 'ירושלים'}

Funcionalidades

Modelo ajustado para responder preguntas en hebreo utilizando el conjunto de datos SQuAD auto-traducido
Entrenado con 52,405 ejemplos en el conjunto de entrenamiento y 7,455 en el conjunto de validación
Parámetros de entrenamiento incluyen: tasa de aprendizaje de 2e-05, tamaño de lote de entrenamiento de 8, tamaño de lote de evaluación de 8, semilla de 42, optimizador Adam con betas=(0.9,0.999) y epsilon=1e-08, tipo de programador de tasa de aprendizaje lineal, y 15 épocas
Tamaño del modelo: 415M
Resultados del entrenamiento: exactitud de 42.6 y puntaje F1 de 55.9
Construido usando Transformers 4.17.0, Pytorch 1.10.0+cu111, Datasets 1.18.4, y Tokenizers 0.11.6

Casos de uso

Responder preguntas en hebreo basadas en el contexto proporcionado
Aplicaciones en entornos educativos para ayudar a los estudiantes a buscar respuestas en textos largos
Asistir a los servicios al cliente ofreciendo respuestas rápidas a preguntas comunes