stanfordmimi/Merlin
stanfordmimi
Texto a imagen
Merlin es un modelo fundacional visión-lenguaje 3D para tomografía computarizada. Fue preentrenado usando historiales clínicos electrónicos estructurados y reportes radiológicos no estructurados, y el repositorio de Hugging Face publica los pesos del modelo junto con un archivo de imagen de ejemplo asociado al trabajo de Nature 2026.
Como usar
Instalación desde PyPI:
pip install merlin-vlm
Instalación editable desde el repositorio:
git clone https://github.com/StanfordMIMI/Merlin.git
cd Merlin
pip install -e .
La página indica que para instrucciones de uso completas se debe consultar el repositorio de GitHub. Hugging Face no muestra aún snippets específicos para la librería Merlin.
Funcionalidades
- Modelo visión-lenguaje 3D especializado en tomografía computarizada.
- Preentrenamiento con datos clínicos estructurados de EHR y reportes radiológicos no estructurados.
- Repositorio con pesos de modelos para tareas clínicas y de radiología.
- Incluye un archivo de imagen de ejemplo en formato NIfTI.
- Licencia MIT.
Casos de uso
- Análisis multimodal de tomografías computarizadas.
- Investigación en modelos fundacionales médicos para radiología.
- Generación o comprensión de reportes radiológicos a partir de imágenes CT.
- Predicción clínica basada en imágenes CT y datos longitudinales de salud.
- Experimentación académica con pesos publicados del modelo Merlin.