gelectra-base-germanquad

deepset
Pregunta y respuesta

Modelo de respuesta a preguntas en alemán basado en gelectra-base. Entrenado con el conjunto de datos GermanQuAD, consiste en un conjunto de entrenamiento anotado manualmente con 11518 preguntas y 11518 respuestas, y un conjunto de prueba anotado tres veces con 2204 preguntas y 6536 respuestas tras eliminar 76 respuestas incorrectas.

Como usar

Entrenamos un modelo alemán de respuesta a preguntas con un modelo gelectra-base como base. El conjunto de datos es GermanQuAD, un nuevo conjunto de datos en alemán que anotamos manualmente y publicamos en línea. El conjunto de datos de entrenamiento está anotado de una sola manera y contiene 11518 preguntas y 11518 respuestas, mientras que el conjunto de prueba está anotado de tres maneras, de modo que hay 2204 preguntas y 6536 respuestas tras eliminar 76 respuestas incorrectas. Para más detalles y descarga del conjunto de datos en formato SQuAD, vea https://deepset.ai/germanquad.

Funcionalidades

Modelo de lenguaje: gelectra-base-germanquad
Idioma: Alemán
Datos de entrenamiento: conjunto de entrenamiento GermanQuAD (~ 12MB)
Datos de evaluación: conjunto de prueba GermanQuAD (~ 5MB)
Infraestructura: 1x GPU V100
Publicado: 21 de abril de 2021

Casos de uso

Respuesta a preguntas en alemán
Desarrollo de sistemas NLP listos para producción con enfoques como respuesta a preguntas, resumen de texto y ranking, entre otros.