bvanaken/clinical-assertion-negation-bert

bvanaken
Clasificación de texto

El modelo BERT de Clasificación de Afirmaciones y Negaciones Clínicas se introduce en el artículo 'Detección de Afirmaciones en Notas Clínicas: ¿Modelos de Lenguaje Médico al Rescate?'. El modelo ayuda a estructurar la información en cartas de pacientes clínicos clasificando las condiciones médicas mencionadas en la carta en PRESENTE, AUSENTE y POSIBLE. El modelo se basa en el ClinicalBERT - Modelo BERT de Resumen de Alta por Alsentzer et al. y se ajustó sobre datos de afirmaciones del desafío i2b2 de 2010.

Como usar

Puedes cargar el modelo a través de la biblioteca transformers:

from transformers import AutoTokenizer, AutoModelForSequenceClassification, TextClassificationPipeline
tokenizer = AutoTokenizer.from_pretrained("bvanaken/clinical-assertion-negation-bert")
model = AutoModelForSequenceClassification.from_pretrained("bvanaken/clinical-assertion-negation-bert")

El modelo espera entradas en forma de fragmentos/oraciones con una entidad marcada para clasificar como PRESENTE(0), AUSENTE(1) o POSIBLE(2). La entidad en cuestión se identifica con el token especial [entity] rodeándola. Ejemplo de entrada e inferencia:

input = "El paciente se recuperó durante la noche y ahora niega cualquier [entity] dificultad para respirar [entity]."

classifier = TextClassificationPipeline(model=model, tokenizer=tokenizer)

classification = classifier(input)
# [{'label': 'AUSENTE', 'score': 0.9842607378959656}]

Funcionalidades

Clasificación de Afirmaciones y Negaciones Clínicas
Basado en el modelo BERT de ClinicalBERT
Fino ajustado sobre datos de afirmaciones del desafío i2b2 de 2010

Casos de uso

Clasificación de condiciones médicas en cartas de pacientes clínicos
Estructuración de información en registros médicos
Detección de la presencia, ausencia o posibilidad de condiciones médicas mencionadas