FremyCompany/BioLORD-2023-M-Dutch-InContext-v1
Este modelo admite la incrustación de entidades biomédicas tanto en inglés como en neerlandés, pero permite la incrustación de conceptos en contexto utilizando una plantilla específica. También admite la incrustación de menciones sin contexto, particularmente en inglés. A diferencia de otros modelos de la serie, este modelo utiliza el token [CLS] para incrustar la mención.
Como usar
Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para tareas como agrupamiento o búsqueda semántica. Este modelo ha sido afinado para el dominio biomédico. Mientras que preserva una buena capacidad para producir incrustaciones para texto de propósito general, será más útil si se desea procesar documentos médicos tales como expedientes médicos electrónicos o notas clínicas. Tanto oraciones como frases pueden incrustarse en el mismo espacio latente. Usar este modelo se vuelve fácil cuando se tiene sentence-transformers instalado:
pip install -U sentence-transformers
from sentence_transformers import SentenceTransformer
sentences = ["wond door kattenscrab", "kattenkrabziekte", "bartonellosis"]
model = SentenceTransformer('FremyCompany/BioLORD-2023-M-Dutch-InContext-v1')
embeddings = model.encode(sentences)
print(embeddings)
Funcionalidades
- Soporte para entidades biomédicas en inglés y neerlandés
- Incrustación de conceptos en contexto
- Utilización del token [CLS] para incrustar menciones
- Compatible con autoentrenamiento
- Compatible con puntos de inferencia
Casos de uso
- Procesamiento de documentos médicos.
- Agrupamiento de datos biomédicos.
- Búsqueda semántica en registros clínicos.
- Extracción de conceptos clínicos en neerlandés.
- Incrustación de menciones biomédicas en inglés y neerlandés.