saiful9379/Bangla_Roberta_Question_and_Answer

saiful9379
Pregunta y respuesta

Este modelo de Preguntas y Respuestas en Bangla utiliza la arquitectura del modelo Roberta, que actualmente está entrenado en un conjunto pequeño de datos anotados por humanos. Sin embargo, un modelo con un corpus más grande está en progreso. Para entrenar este modelo, los datos de QA en Bangla se han convertido al formato SQuAD v2 y se han preprocesado. El conjunto de datos contiene 2504 pares de preguntas y respuestas.

Como usar

from transformers import AutoModelForQuestionAnswering, AutoTokenizer, pipeline

model = AutoModelForQuestionAnswering.from_pretrained("saiful9379/Bangla_Roberta_Question_and_Answer")
tokenizer = AutoTokenizer.from_pretrained("saiful9379/Bangla_Roberta_Question_and_Answer")

context = "বাংলাদেশ ও ভারতের অনেক বৃহৎ নদী পূর্ব থেকে পশ্চিমে প্রবাহিত হয়ে বঙ্গোপসাগরে পতিত হয়েছে।\
তন্মধ্যে উত্তরদিক থেকে গঙ্গা, মেঘনা এবং ব্রহ্মপুত্র; দক্ষিণদিক থেকে মহানদী, গোদাবরী, কৃষ্ণা, ইরাবতী এবং কাবেরী নদী উল্লেখযোগ্য।\
৬৪ কিলোমিটারব্যাপী (৪০ মাইল) কৌম নদী সবচেয়ে ছোট নদী হিসেবে সরু খাল দিয়ে এবং ২,৯৪৮ কিলোমিটারব্যাপী (১,৮৩২ মাইল)\
বিশ্বের ২৮তম দীর্ঘ নদী হিসেবে ব্রহ্মপুত্র নদ বাংলাদেশ, চীন, নেপাল ও ভারতের মধ্য দিয়ে প্রবাহিত হয়ে বঙ্গোপসাগরে মিলিত হয়েছে।\
সুন্দরবন ম্যানগ্রোভ বনাঞ্চল গঙ্গা, ব্রহ্মপুত্র ও মেঘনা নদীর ব-দ্বীপকে ঘিরে গঠিত হয়েছে। মায়ানমারের (সাবেক বার্মা) ইরাওয়াদি (সংস্কৃত ইরাবতী)\
নদীও এ উপসাগরে মিলিত হয়েছে এবং একসময় গভীর ও ঘন ম্যানগ্রোভ বনাঞ্চলের সৃষ্টি করেছিল."

question = "ব্রহ্মপুত্র নদের মোট দৈর্ঘ্য কত?"

QA = pipeline('question-answering', model=model, tokenizer=tokenizer)
QA_input = {'question': question, 'context': context}

prediction = QA(QA_input)
print(prediction)

Funcionalidades

Arquitectura del modelo Roberta
Entrenado en un conjunto pequeño de datos anotados por humanos
Datos convertidos al formato SQuAD v2
2504 pares de preguntas y respuestas

Casos de uso

Responder preguntas en bangla
Desplegar aplicaciones de preguntas y respuestas en bangla
Entrenamiento adicional con datos más grandes del corpus
Preservación de la historia y cultura bangladesí a través de la tecnología QA