stanfordmimi/Merlin

stanfordmimi
Texto a imagen

Merlin es un modelo fundacional visión-lenguaje 3D para tomografía computarizada. Fue preentrenado usando historiales clínicos electrónicos estructurados y reportes radiológicos no estructurados, y el repositorio de Hugging Face publica los pesos del modelo junto con un archivo de imagen de ejemplo asociado al trabajo de Nature 2026.

Como usar

Instalación desde PyPI:

pip install merlin-vlm

Instalación editable desde el repositorio:

git clone https://github.com/StanfordMIMI/Merlin.git
cd Merlin
pip install -e .

La página indica que para instrucciones de uso completas se debe consultar el repositorio de GitHub. Hugging Face no muestra aún snippets específicos para la librería Merlin.

Funcionalidades

Modelo visión-lenguaje 3D especializado en tomografía computarizada.
Preentrenamiento con datos clínicos estructurados de EHR y reportes radiológicos no estructurados.
Repositorio con pesos de modelos para tareas clínicas y de radiología.
Incluye un archivo de imagen de ejemplo en formato NIfTI.
Licencia MIT.

Casos de uso

Análisis multimodal de tomografías computarizadas.
Investigación en modelos fundacionales médicos para radiología.
Generación o comprensión de reportes radiológicos a partir de imágenes CT.
Predicción clínica basada en imágenes CT y datos longitudinales de salud.
Experimentación académica con pesos publicados del modelo Merlin.