gelectra-base-germanquad
Modelo de respuesta a preguntas en alemán basado en gelectra-base. Entrenado con el conjunto de datos GermanQuAD, consiste en un conjunto de entrenamiento anotado manualmente con 11518 preguntas y 11518 respuestas, y un conjunto de prueba anotado tres veces con 2204 preguntas y 6536 respuestas tras eliminar 76 respuestas incorrectas.
Como usar
Entrenamos un modelo alemán de respuesta a preguntas con un modelo gelectra-base como base. El conjunto de datos es GermanQuAD, un nuevo conjunto de datos en alemán que anotamos manualmente y publicamos en línea. El conjunto de datos de entrenamiento está anotado de una sola manera y contiene 11518 preguntas y 11518 respuestas, mientras que el conjunto de prueba está anotado de tres maneras, de modo que hay 2204 preguntas y 6536 respuestas tras eliminar 76 respuestas incorrectas.
Para más detalles y descarga del conjunto de datos en formato SQuAD, vea https://deepset.ai/germanquad.
Funcionalidades
- Modelo de lenguaje: gelectra-base-germanquad
- Idioma: Alemán
- Datos de entrenamiento: conjunto de entrenamiento GermanQuAD (~ 12MB)
- Datos de evaluación: conjunto de prueba GermanQuAD (~ 5MB)
- Infraestructura: 1x GPU V100
- Publicado: 21 de abril de 2021
Casos de uso
- Respuesta a preguntas en alemán
- Desarrollo de sistemas NLP listos para producción con enfoques como respuesta a preguntas, resumen de texto y ranking, entre otros.