ARDisplay-I

ardigen
Clasificación de texto

El modelo predice la presentación de péptidos en la superficie celular a través de una molécula de HLA de clase I dada. Fue introducido en el artículo Identificación de ligandos MHC específicos de tumores mediante el aislamiento bioquímico mejorado y la incorporación del aprendizaje automático por Shima Mecklenbräuker y otros. El sistema inmunológico puede reconocer células anormales mediante la presentación de péptidos-HLA (pHLA). ARDisplay-I predice si un péptido dado se mostrará en la superficie celular a través de una molécula de HLA de clase I. Esta predicción abarca todo el proceso de procesamiento y presentación. En la mayoría de los escenarios de aplicación, el modelo requiere pasos adicionales de post-procesamiento y filtrado apropiado. Desarrollado por Ardigen como parte de la plataforma de inmunología, el acceso gratuito a la versión regular está disponible en la plataforma Hugging Face para uso académico no comercial. Envía un correo a [email protected] para uso comercial y versiones Pro.

Como usar

Puedes visitar nuestra demostración interactiva y probar el modelo allí. Alternativamente, puedes ejecutar el modelo en tu máquina desde Python como una herramienta CLI siguiendo las siguientes secciones.

from transformers import pipeline

pipe = pipeline(model="ardigen/ardisplay-i", trust_remote_code=True)
data = ["A01:02,AAAAAAAA", "A01:02,CCCCCCCCCC"]
result = pipe(data)
print(result)

Los péptidos pasados al modelo deben tener una longitud de entre 8 y 11 AAs y no pueden contener descriptores de aminoácidos ambiguos, como X, B, Z, J, etc.

CLI

También puedes instalar el modelo como una herramienta CLI para su uso en pipelines bioinformáticos con el siguiente comando (suponiendo que tengas python3 y pip instalados)

wget https://huggingface.co/ardigen/ardisplay-i/raw/main/cli/install.sh -O - | bash

Esto instalará la herramienta ardisplay-i-cli que toma un archivo de texto con una lista de pares HLA,péptido y genera un archivo .csv. Consulta ardisplay-i-cli --help para más detalles.

Funcionalidades

Predicción de presentación de péptidos-HLA (pHLA)
Modelo desarrollado por Ardigen S.A.
Modelo de lenguaje de proteínas
Previsión de la presentación en la superficie celular
Compatibilidad con un conjunto predefinido de HLAs
Requiere péptidos de 8 a 11 aminoácidos

Casos de uso

Seleccionar péptidos con la mayor probabilidad de ser presentados por moléculas HLA específicas
Encontrar fragmentos de proteínas con alta probabilidad de presentación
Buscar múltiples HLAs que presenten un péptido dado
Escanear una proteína completa en búsqueda de subsecuencias presentadas