FremyCompany/BioLORD-2023-M-Dutch-InContext-v1

FremyCompany
Similitud de oraciones

Este modelo admite la incrustación de entidades biomédicas tanto en inglés como en neerlandés, pero permite la incrustación de conceptos en contexto utilizando una plantilla específica. También admite la incrustación de menciones sin contexto, particularmente en inglés. A diferencia de otros modelos de la serie, este modelo utiliza el token [CLS] para incrustar la mención.

Como usar

Este es un modelo de sentence-transformers: Mapea oraciones y párrafos a un espacio vectorial denso de 768 dimensiones y se puede usar para tareas como agrupamiento o búsqueda semántica. Este modelo ha sido afinado para el dominio biomédico. Mientras que preserva una buena capacidad para producir incrustaciones para texto de propósito general, será más útil si se desea procesar documentos médicos tales como expedientes médicos electrónicos o notas clínicas. Tanto oraciones como frases pueden incrustarse en el mismo espacio latente. Usar este modelo se vuelve fácil cuando se tiene sentence-transformers instalado:

pip install -U sentence-transformers

from sentence_transformers import SentenceTransformer

sentences = ["wond door kattenscrab", "kattenkrabziekte", "bartonellosis"]

model = SentenceTransformer('FremyCompany/BioLORD-2023-M-Dutch-InContext-v1')
embeddings = model.encode(sentences)
print(embeddings)

Funcionalidades

Soporte para entidades biomédicas en inglés y neerlandés
Incrustación de conceptos en contexto
Utilización del token [CLS] para incrustar menciones
Compatible con autoentrenamiento
Compatible con puntos de inferencia

Casos de uso

Procesamiento de documentos médicos.
Agrupamiento de datos biomédicos.
Búsqueda semántica en registros clínicos.
Extracción de conceptos clínicos en neerlandés.
Incrustación de menciones biomédicas en inglés y neerlandés.