Indobert-QA
Rifky
Pregunta y respuesta
IndoBERT entrenado por IndoLEM y ajustado en el conjunto SQuAD 2.0 traducido para la tarea de preguntas y respuestas (Q&A). Este proyecto es parte de una investigación titulada 'Teman Belajar: Asisten Digital Pelajar SMA Negeri 28 Jakarta dalam Membaca' para KOPSI (Kompetisi Penelitian Siswa Indonesia). El tamaño del modelo después del entrenamiento es de 420MB.
Como usar
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="Rifky/Indobert-QA",
tokenizer="Rifky/Indobert-QA"
)
qa_pipeline({
'context': """Pangeran Harya Dipanegara (atau biasa dikenal dengan nama Pangeran Diponegoro, lahir di Ngayogyakarta Hadiningrat, 11 November 1785 – meninggal di Makassar, Hindia Belanda, 8 Januari 1855 pada umur 69 tahun) adalah salah seorang pahlawan nasional Republik Indonesia, yang memimpin Perang Diponegoro atau Perang Jawa selama periode tahun 1825 hingga 1830 melawan pemerintah Hindia Belanda. Sejarah mencatat, Perang Diponegoro atau Perang Jawa dikenal sebagai perang yang menelan korban terbanyak dalam sejarah Indonesia, yakni 8.000 korban serdadu Hindia Belanda, 7.000 pribumi, dan 200 ribu orang Jawa serta kerugian materi 25 juta Gulden.""",
'question': "kapan pangeran diponegoro lahir?"
})
output:
{
'answer': '11 November 1785',
'end': 131,
'score': 0.9272009134292603,
'start': 115
}
Funcionalidades
- Modelo BERT en indonesio entrenado en más de 220M de palabras.
- Ajustado en el conjunto de datos SQuAD 2.0 traducido.
- Optimizado para tareas de preguntas y respuestas (Q&A).
- Tamaño del modelo: 420MB.
- Entrenado por 2.4M pasos (180 épocas) con una perplejidad final de 3.97.
Casos de uso
- Responder preguntas basadas en texto.
- Asistente digital para estudiantes.
- Investigaciones y competencias estudiantiles.