La combinación del metaboloma y los indicadores clínicos con el aprendizaje automático proporciona algunos marcadores de diagnóstico prometedores para detectar con precisión el frotis
HogarHogar > Noticias > La combinación del metaboloma y los indicadores clínicos con el aprendizaje automático proporciona algunos marcadores de diagnóstico prometedores para detectar con precisión el frotis

La combinación del metaboloma y los indicadores clínicos con el aprendizaje automático proporciona algunos marcadores de diagnóstico prometedores para detectar con precisión el frotis

Oct 03, 2023

BMC Infectious Diseases volumen 22, Número de artículo: 707 (2022) Citar este artículo

1276 Accesos

4 citas

1 Altmetric

Detalles de métricas

La tuberculosis (TB) había sido la principal enfermedad infecciosa letal en todo el mundo durante mucho tiempo (2014-2019) hasta la pandemia mundial de COVID-19, y sigue siendo una de las 10 principales causas de muerte en todo el mundo. Una razón importante por la que hay tantos pacientes con TB y casos de muerte en el mundo es por las dificultades en el diagnóstico preciso de TB utilizando métodos de detección comunes, especialmente para algunos casos de tuberculosis pulmonar con frotis negativo (SNPT). El rápido desarrollo del metaboloma y el aprendizaje automático ofrece una gran oportunidad para el diagnóstico de precisión de la TB. Sin embargo, los biomarcadores de metabolitos para el diagnóstico de precisión de la tuberculosis pulmonar con baciloscopía positiva y baciloscopía negativa (SPPT/SNPT) aún no se han descubierto. En este estudio, combinamos la metabolómica y los indicadores clínicos con el aprendizaje automático para descartar nuevos biomarcadores de diagnóstico para la identificación precisa de pacientes con SPPT y SNPT.

Se realizó un perfil metabolómico de plasma no dirigido para 27 pacientes con SPPT, 37 pacientes con SNPT y controles. Luego se realizó el análisis discriminante de mínimos cuadrados parciales ortogonales (OPLS-DA) para detectar metabolitos diferenciales entre los tres grupos. Las vías enriquecidas con metabolitos, el bosque aleatorio (RF), las máquinas de vectores de soporte (SVM) y la red neuronal de perceptrón multicapa (MLP) se realizaron utilizando Metaboanalyst 5.0, el paquete R "caret", el paquete R "e1071" y el paquete Python "Tensorflow", respectivamente.

El análisis metabolómico reveló un enriquecimiento significativo de metabolitos de ácidos grasos y aminoácidos en el plasma de pacientes con SPPT y SNPT, donde las muestras de SPPT mostraron una disfunción más grave en los metabolismos de ácidos grasos y aminoácidos. El análisis de RF adicional reveló cuatro combinaciones optimizadas de biomarcadores de diagnóstico que incluyen diez características (dos moléculas de lípidos/similares a lípidos y siete ácidos orgánicos/derivados, y un indicador clínico) para la identificación de pacientes SPPT, SNPT y controles con alta precisión (83–93 % ), que fueron posteriormente verificados por SVM y MLP. Entre ellos, MLP mostró el mejor rendimiento de clasificación en la identificación precisa simultánea de los tres grupos (94,74 %), lo que sugiere la ventaja de MLP sobre RF/SVM hasta cierto punto.

Nuestros hallazgos revelan las características metabolómicas del plasma de los pacientes con SPPT y SNPT, proporcionan algunos marcadores de diagnóstico novedosos y prometedores para el diagnóstico de precisión de varios tipos de TB y muestran el potencial del aprendizaje automático para detectar biomarcadores a partir de grandes datos.

Informes de revisión por pares

Según los informes de la OMS, la tuberculosis (TB) causada por Mycobacterium tuberculosis (Mtb) había sido la principal enfermedad infecciosa letal en todo el mundo durante mucho tiempo (2014-2019) hasta la pandemia mundial de COVID-19 (2020-2021) [1], y hubo ~ 10 millones de nuevos casos de TB cada año [2, 3]. Según los datos recopilados del Sistema Nacional de Informes de Enfermedades de Notificación Obligatoria (NNDRS), la incidencia anual de Xinjiang es de 169,05/100 000 y la tasa media anual de PTB (tuberculosis pulmonar) notificada en Kashgar fue de 450,91/100 000 entre 2011 y 2020 [4] . ¿Por qué hay tantos pacientes con tuberculosis y casos de muerte en todo el mundo? Una de las razones es debido a las dificultades en el diagnóstico preciso de la TB, especialmente para algunos casos de tuberculosis pulmonar con frotis negativo (SNPT) que generalmente muestran síntomas similares a otras enfermedades pulmonares [5, 6]. En algunos países/regiones, los pacientes con SNPT representan incluso más del 50 % de todos los casos de TB [7].

En la actualidad, aunque tres métodos comunes (microscopía de frotis de esputo, pruebas de cultivo de esputo y ensayos Xpert MTB/RIF) pueden lograr un diagnóstico relativamente preciso para la mayoría de los pacientes con TB, todavía tienen algunas desventajas (como una sensibilidad relativamente baja para la microscopía de frotis de esputo, requiere mucho tiempo para el cultivo de esputo y un costo relativamente alto para Xpert), lo que lleva aún más a algunos casos falsos negativos/positivos [1, 6, 8, 9, 10]. El diagnóstico fallido puede dar como resultado un tratamiento retrasado, un efecto terapéutico deficiente y costos de tratamiento más altos [11, 12]. Hoy en día, cómo detectar de manera oportuna y precisa varios tipos de TB sigue siendo un desafío importante para el control mundial de la TB.

El rápido desarrollo de varias tecnologías ómicas ofrece una gran oportunidad para el diagnóstico de precisión de varios tipos de enfermedades [13,14,15,16]. Entre ellos, el metaboloma se ha aplicado ampliamente en el descubrimiento de biomarcadores para la detección, diagnóstico y tratamiento de diversas enfermedades, ya que se ha informado que están estrechamente asociados con genotipos y fenotipos de enfermedades [17]. En el campo de la investigación de la TB, Deng et al. informaron cambios significativos en el glutatión y la histamina en la orina de pacientes con tuberculosis activa, lo que podría distinguirlos de los pacientes infectados con tuberculosis latente [18]; Huang et al. proporcionaron algunos biomarcadores de metabolitos plasmáticos potenciales (xantina, 4-piridoxato y ácido d-glutámico) para el diagnóstico de TB [19]; Sun et al. revelaron algunos biomarcadores de metabolitos potenciales para el diagnóstico de TB pediátrica mediante l-valina, ácido pirúvico y betaína en plasma [20]. Sin embargo, quedan por descubrir los biomarcadores de metabolitos para el diagnóstico de precisión de la tuberculosis con baciloscopía positiva y baciloscopía negativa (SPPT y SNPT).

En nuestro estudio, realizamos análisis metabolómicos en plasma de 27 pacientes con SPPT, 37 pacientes con SNPT y 36 controles. El perfil metabolómico reveló metabolismos disfuncionales de ácidos grasos y aminoácidos en pacientes con SPPT y SNPT. Luego, se seleccionaron cuatro combinaciones de biomarcadores de diagnóstico optimizadas (dos moléculas de lípidos/similares a lípidos y siete ácidos orgánicos/derivados, y un indicador clínico) para un diagnóstico preciso de pacientes con SPPT y SNPT y controles a través del bosque aleatorio (RF). El rendimiento de clasificación de las cuatro combinaciones se verificó aún más mediante otros dos métodos de aprendizaje automático: máquinas de vectores de soporte (SVM) y red neuronal de perceptrón multicapa (MLP). Nuestros hallazgos revelaron las características metabolómicas de los pacientes con SPPT y SNPT, proporcionaron algunos marcadores de diagnóstico prometedores para el diagnóstico de precisión de varios tipos de pacientes con TB y mostraron el potencial del aprendizaje automático en la detección de biomarcadores de diagnóstico.

En nuestro estudio, todos los pacientes con TB (incluidos 27 pacientes con SPPT y 37 con SNPT) fueron reclutados del Instituto de Tratamiento y Prevención de la Tuberculosis de Kashgar, el Segundo Hospital Popular de Aksu y el Hospital de Enfermedades Infecciosas del Condado de Kuqa durante octubre de 2017 a octubre de 2018. También se inscribieron 36 personas de control (Ctrl) sin infección de TB del Primer Hospital Afiliado de la Universidad Médica de Xinjiang (Tabla 1, Archivo adicional 1: Fig. S1). El diagnóstico de TB se basó en síntomas clínicos y evidencia microbiológica según el Diagnóstico de Tuberculosis Pulmonar (WS 288-2017). Los pacientes con SPPT fueron diagnosticados cuando se obtuvo una de las siguientes pruebas microbiológicas: (1) tinción positiva para bacilos acidorresistentes, (2) cultivo positivo para Mtb, (3) prueba Xpert positiva. Los pacientes con SNPT fueron diagnosticados en base a los síntomas clínicos clásicos, aunque los bacilos acidorresistentes fueron negativos. Los criterios de exclusión incluyeron: (1) los pacientes con TB en período de tratamiento; (2) los pacientes de TB con otras enfermedades crónicas o agudas como complicaciones del embarazo, disfunción cardíaca, enfermedad renal, enfermedad psiquiátrica, enfermedad gastrointestinal, hipertensión no controlada y algunos estados de estrés severo (incluyendo eventos cardiovasculares y cerebrovasculares, infección severa, cirugía traumática, y enfermedades consuntivas graves). Este estudio fue aprobado por el Comité de Ética del Primer Hospital Afiliado de la Universidad Médica de Xinjiang (20171123-06-1908A).

Se recolectó un total de 0,5 a 1 ml de la muestra de sangre completa de cada participante mediante flebotomía de la vena cubital utilizando un tubo de recolección de anticoagulantes con heparina. Luego, las muestras de sangre se centrifugaron durante 10 min (1500 rpm/min, 4 °C) para eliminar las células sanguíneas, y los sobrenadantes se congelaron inmediatamente en nitrógeno líquido y se almacenaron a -80 °C hasta su uso. Las muestras de plasma congeladas se descongelaron lentamente a 4 °C y cada alícuota de 100 μl se mezcló con 400 μl de solución de metanol/acetonitrilo (1:1, v/v) previamente enfriada. Después del vórtice, la mezcla se incubó a -20 °C durante 10 min y luego se centrifugó durante 15 min (14 000 rcf, 4 °C). Los sobrenadantes se liofilizaron y se reconstituyeron en 100 μL de solución de acetonitrilo/agua (1:1, v/v) para análisis LC-MS/MS (Shanghai Applied Protein Technology Co., Ltd, Shanghái, China).

Los metabolitos se extrajeron de muestras de plasma. El análisis de metabolómica no dirigida se llevó a cabo utilizando cromatografía líquida de rendimiento ultraalto (UHPLC, 1290 Infinity LC, Agilent Technologies, Palo Alto, CA, EE. UU.) y un espectrómetro de masas de tiempo de vuelo de cuadrupolo (TripleTOF 6600; AB Sciex, MA, EE. UU.). La separación se realizó utilizando una columna ACQUITY UPLC BEH de 1,7 μm de 2,1 mm × 100 mm (Waters, Wexford, Irlanda). La fase móvil consistía en A. acetato de amonio 25 mM con hidróxido de amonio 25 mM; B. acetonitrilo. La elución del gradiente se realizó de la siguiente manera: 95 % de B durante 0,5 min y se redujo linealmente al 65 % en 7 min, luego, el gradiente se redujo al 40 % en 2 min, se incrementó al 95 % en 0,1 min, luego con un re -período de equilibrio empleado durante 3 min. El caudal se fijó en 0,3 mL min−1, la temperatura de la columna a 25 °C y el volumen de inyección de 2 µL. Las condiciones de ESI fueron las siguientes: Fuente de iones Gas1 (Gas1): 40 psi; Fuente de iones Gas2 (Gas2): 80 psi; cortina de gas (CUR): 30 psi; temperatura de la fuente: 650 ℃; IonSpray Voltage Floating (ISVF) ± 5500 V. MSconventer (ProteoWizard, Palo Alto, CA, EE. UU.) convirtió los datos sin procesar a MzXML y los importó al software XCMS (Scripps Research Institute, La Jolla, CA, EE. UU.) para la alineación, detección de características, corrección del tiempo de retención y filtrado de datos.

El análisis multivariable se realizó con el software SIMCA-P (versión 14.1 Umetrics, Umea, Suecia). Luego se realizó el análisis discriminante de mínimos cuadrados parciales ortogonales (OPLS-DA, Umetrics, Umea, Suecia) para seleccionar los metabolitos diferenciales, y se evaluó la solidez del modelo OPLS-DA mediante el uso de la prueba de permutación de respuesta y validación cruzada de siete veces. . Los metabolitos diferencialmente abundantes (DAM) se confirmaron en función de la importancia variable en la proyección (VIP) > 1 obtenida del modelo OPLS-DA y los valores p de la prueba t de Student (p < 0,05). La taxonomía química de los DAM se determinó de acuerdo con "The Human Metabolome Database (HMDB)" (https://hmdb.ca/). El análisis de la ruta enriquecida con metabolitos se implementó con el software en línea Metaboanalyst 5.0 [21].

Después de eliminar los indicadores con una gran proporción de valores faltantes (≥ 20 %, para obtener detalles, consulte el Archivo adicional 1: Tabla S1), se incluyeron 24 indicadores clínicos restantes y 96 DAM para descartar posibles biomarcadores de diagnóstico. Luego, las variables categóricas se codificaron con variables ficticias. Un total de 100 personas (27 pacientes con SPPT, 37 pacientes con SNPT y 36 controles) se separaron aleatoriamente en un conjunto de entrenamiento (n = 81) y un conjunto de prueba (n = 19) utilizando la función createDataPartition en el paquete R caret (http:/ /topepo.github.io/caret/data-splitting.html). Además, se adoptó K-Nearest Neighbor para imputar los valores faltantes de los indicadores restantes [22]. Específicamente, se creó un modelo KNN (http://topepo.github.io/caret/pre-processing.html) basado en el conjunto de entrenamiento, que luego se aplicó para predecir los valores faltantes en el conjunto de prueba. Como resultado, se obtuvieron los conjuntos de datos estandarizados. Luego se aplicó el análisis de componentes principales (PCA) para detectar indicadores clínicos globales y alteraciones metabólicas entre diferentes muestras [23]. Los coeficientes de correlación de Pearson entre los indicadores clínicos y los DAM se calcularon mediante la función findCorrelation en el software R (https://github.com/topepo/caret/blob/master/pkg/caret/R/findCorrelation.R). Se excluyeron las características con correlaciones absolutas medias altas (≥ 0,7) (archivo adicional 2).

En primer lugar, se incluyeron los 20 indicadores clínicos preseleccionados y los 58 DAM identificados (78 características, definidas como conjunto F0) para la clasificación de los grupos SPPT/Ctrl, SNPT/Ctrl, SPPT/SNPT y SPPT/SNPT/Ctrl. Luego se adoptó RF para evaluar el rendimiento de clasificación del conjunto F0. Las AUC se calcularon mediante el análisis de las características operativas del receptor (ROC) utilizando la función roc () del paquete pROC en R [24].

Luego usamos la eliminación recursiva de funciones (marca de intercalación del paquete R) para disminuir la cantidad de funciones en el modelo de RF (uso de parámetros "rfFuncs" y "cv") [25]. La disminución media en el coeficiente de Gini (MDG) se usó aún más para medir la importancia de las variables, y finalmente se seleccionaron las combinaciones de características importantes con una precisión superior al 90 % para el aprendizaje automático. Aquí, las funciones seleccionadas en los grupos SPPT/Ctrl, SNPT/Ctrl, SPPT/SNPT y SPPT/SNPT/Ctrl se definieron como F1, F2, F3 y F4, respectivamente. En última instancia, las precisiones de clasificación de los cuatro conjuntos de funciones anteriores se verificaron mediante otros dos métodos de aprendizaje automático: SVM y MLP. El SVM se realizó utilizando el paquete R "e1071". El algoritmo de clasificación MLP que incluye dos capas ocultas (cada capa consta de 15 nodos) se completó utilizando el paquete "Tensorflow" de Python [26]. Para evitar el sobreajuste, se empleó una validación cruzada (CV) de diez veces en el conjunto de trenes, que se dividió aleatoriamente en 90% para el "conjunto de trenes real" y 10% para el "conjunto de validación" diez veces. En última instancia, los conjuntos de prueba se utilizaron para evaluar la precisión, la sensibilidad, la especificidad, el valor predictivo positivo (PPV) y el valor predictivo negativo (NPV) de cada modelo entrenado. Los códigos se depositaron en GitHub (https://github.com/ChenF-Lab/SPPT.git).

Las variables continuas se describieron mediante media ± desviación estándar, mediana y rangos intercuartílicos (Q1-Q3). Las variables categóricas se describieron como tasas de frecuencia y porcentajes. Se utilizó la prueba t de muestras independientes para comparar las medias de las variables distribuidas normalmente, mientras que la prueba U de Mann Whitney para las variables no distribuidas normalmente. Se utilizaron las pruebas ANOVA de una vía o Kruskal Wallis para comparar las variables entre los tres grupos. Las variables categóricas se compararon mediante la prueba de chi-cuadrado. Se aplicó la corrección de Bonferroni-Holm para obtener el valor de p corregido para comparaciones múltiples. Todos los análisis estadísticos se realizaron utilizando el software R (versión 4.0.2; un software gratuito de código abierto). Los valores de p bilaterales inferiores a 0,05 se consideraron estadísticamente significativos.

En nuestro estudio, se inscribieron 64 pacientes con TB, incluidos 27 pacientes con SPPT y 37 pacientes con SNPT, para identificar los biomarcadores candidatos para el diagnóstico de tuberculosis. 36 personas sin TB también se incluyeron como controles. Aquí, la mayoría de los pacientes con TB son hombres (59,4%) y más del 80% de los pacientes con TB son agricultores. La mediana de edad de los pacientes con SNPT fue de 60,0 años (Q1–Q3: 49,00–71,00), que fue significativamente mayor que la de los pacientes con SPPT (51,0 años, Q1–Q3: 32,50–71,00) y los controles (43,5 años, Q1 –Q3: 34.00–59.25). Los IMC medios de los pacientes con SPPT y SNPT fueron de 20,22 kg/m2 (SD: 3,95) y 22,82 kg/m2 (SD: 3,93), respectivamente, que fueron significativamente más bajos que los controles (p < 0,001). Los síntomas comunes fueron tos (92,3%) y expectoración (92,3%), seguidos de disnea (54,7%) y malestar torácico (20,3%). En particular, el 70,4% de los pacientes con SPPT pertenecen a la TB pulmonar cavitaria, que se ha demostrado previamente que está asociada con una mayor carga bacteriana [27] (Tabla 1).

El análisis de las características clínicas mostró una disminución significativa de la albúmina y la creatinina sérica y un aumento de la velocidad de sedimentación globular (VSG) en los pacientes con tuberculosis (Tabla 2). Aquí, la albúmina de los pacientes con SPPT fue significativamente más baja que la de los pacientes con SNPT (SPPT: 35,30 g/L; SNPT: 39,20 g/L; p ajustada = 0,002), lo que indica una inflamación/desnutrición crónica más grave para los pacientes con SPPT [28, 29]; la creatinina sérica fue significativamente menor en los pacientes con TB en comparación con los controles, pero no mostró diferencias entre los pacientes con SPPT y SNPT, lo que sugiere lesión renal inducida por fármacos antituberculosos; la VSG de los pacientes con SPPT (67,50 mm/h) fue significativamente más alta que la de los pacientes con SNPT (43,00 mm/h), y se informó que la VSG identifica la tuberculosis activa y diferencia la tuberculosis pulmonar de la neumonía bacteriana adquirida en la comunidad [30].

Además, los neutrófilos, la proteína C reactiva y la procalcitonina se regularon significativamente al alza en los pacientes con SPPT que en los de SNPT, mientras que la hemoglobina de los pacientes con SPPT se reguló significativamente a la baja que en los de SNPT. Todos estos indicadores estaban en el rango normal para los pacientes con SNPT, lo que refleja reacciones inmunitarias e inflamatorias más fuertes de los pacientes con SPPT.

El análisis del metaboloma se realizó en las muestras de plasma de los grupos SPPT, SNPT y Ctrl, y se identificaron un total de 103 DAM (Fig. 1A, B y archivos adicionales 3, 4, 5). El mapa de calor mostró los perfiles de expresión de DAM para los tres grupos, y el perfil metabolómico de los pacientes con SPPT fue más similar al de los pacientes con SNPT que al de los controles (Fig. 1A). Luego, clasificamos todos los DAM en nueve categorías según su taxonomía química de acuerdo con "The Human Metabolome Database" (https://hmdb.ca/), que incluye "Lípidos y moléculas similares a lípidos" (~ 44%), "Ácidos orgánicos y derivados" (~ 25%), "Compuestos organoheterocíclicos" (12%) y "Compuestos orgánicos de oxígeno" (~ 10%) (Fig. 1C).

Análisis metabolómico del plasma para pacientes con SPPT, pacientes con SNPT y controles. Un mapa de calor que muestra 103 metabolitos abundantes diferenciales (DAM, VIP > 1, p < 0,05) entre los tres grupos. La barra de color sobre el mapa de calor representa las muestras SPPT (rojo), SNPT (naranja) y Ctrl (verde). La clave de color indica los niveles de expresión escalados de los 103 metabolitos para los tres grupos. B Diagrama de Venn que muestra los metabolitos diferenciales entre los tres grupos. C Gráfico circular que muestra la clasificación química de los 103 metabolitos significativamente diferencialmente abundantes según la base de datos HMDB

En el grupo SPPT/Ctrl, se identificaron 70 DAM, la mayoría de los cuales eran lípidos/moléculas similares a lípidos (31) y ácidos orgánicos/derivados (16) (archivo adicional 3). En comparación con los controles, el 77 % (24/31) de los lípidos/moléculas similares a los lípidos (19 acilos grasos, 3 glicerofosfolípidos, etc.) y el 81,5 % (13/16) de los ácidos orgánicos/derivados mostraron una tendencia significativamente regulada a la baja. (FC < 1, p < 0,05) en el grupo SPPT, lo que indica el metabolismo disfuncional de lípidos y aminoácidos en los pacientes SPPT como se informó anteriormente [31, 32].

En el grupo SNPT/Ctrl, se obtuvieron 79 DAM, la mayoría de los cuales también pertenecían a moléculas de lípidos/similares a lípidos (37, top-1) y ácidos orgánicos/derivados (16, top-2) (Archivo adicional 4). En comparación con los controles, el 73 % (27/37) de lípidos/moléculas similares a lípidos y el 56 % (9/16) de ácidos orgánicos/derivados mostraron una tendencia significativamente regulada a la baja en las muestras de SNPT, lo que también indica metabolismos disfuncionales de lípidos y aminoácidos. en los pacientes del SNPT.

En el grupo SPPT/SNPT se identificaron 33 DAM, la mayoría de las cuales también pertenecían a moléculas lípido/lipídicas (17) y ácidos orgánicos/derivados (10) (Ficha adicional 5): 53% (9/17) de los Las moléculas de lípidos/similares a lípidos estaban significativamente reguladas a la baja (4 acilos grasos, 2 glicerofosfolípidos, 2 lípidos de prenol, etc.), y el 47 % (8/17) de ellas estaban significativamente reguladas al alza (5 acilos grasos y 3 esteroides/derivados de esteroides). ); El 90% (9/10) de los ácidos orgánicos/derivados estaban significativamente regulados a la baja (ocho ácidos carboxílicos y derivados y un ácido carbónico orgánico/derivado), y solo uno estaba significativamente regulado al alza (hidroxiácido/derivado).

En total, los tres grupos (SPPT/Ctrl, SPPT/Ctrl y SPPT/SNPT) mostraron enriquecimientos significativos en lípidos/moléculas similares a lípidos (top-1) y ácidos orgánicos/derivados (top-2).

Para evaluar las características metabólicas de los tres grupos, realizamos además el análisis de la vía para estos DAM utilizando MetaboAnalyst 5.0. Los resultados mostraron un enriquecimiento significativamente diferencial de las vías relacionadas con el metabolismo de lípidos y aminoácidos entre los tres grupos (Fig. 2 y Archivo adicional 1: Tabla S2–S4). En el grupo SPPT/Ctrl, los DAM se enriquecieron significativamente en dos vías relacionadas con el metabolismo de los ácidos grasos ("vía de la biosíntesis de ácidos grasos insaturados", "vía del metabolismo del ácido linoleico") y una vía relacionada con el metabolismo de los aminoácidos ("valina, leucina e isoleucina ruta de biosíntesis"), lo que indica metabolismos de aminoácidos y ácidos grasos insaturados significativamente no regulados en las muestras de SPPT como se informó anteriormente [32,33,34,35]. En el grupo SNPT/Ctrl, las DAM se enriquecieron significativamente en las mismas dos vías relacionadas con ácidos grasos que en el grupo SPPT/Ctrl. En el grupo SPPT/SNPT, se enriquecieron significativamente cuatro vías metabólicas relacionadas con los lípidos, que incluyen la "vía del metabolismo del ácido linoleico", la "vía del metabolismo de los glicerofosfolípidos", la "vía del metabolismo del ácido alfa-linolénico" y la "vía de la biosíntesis de los ácidos grasos insaturados". lo que indica una disfunción más grave del metabolismo de los ácidos grasos en los pacientes con SPPT que en los pacientes con SNPT. En general, los tres grupos (SPPT/Ctrl, SNPT/Ctrl y SPPT/SNPT) compartieron las dos vías relacionadas con el metabolismo de ácidos grasos insaturados de enriquecimiento significativo, lo que indica metabolismos de ácidos grasos disfuncionales similares entre los tres grupos; deben estar asociados con el progreso de la enfermedad de la TB.

Gráficos de dispersión que muestran las vías metabólicas significativamente enriquecidas entre los tres grupos. El tamaño y el color de los círculos indican la puntuación de impacto y el valor p de las rutas enriquecidas, respectivamente

Tomados en conjunto, los resultados anteriores mostraron las disfunciones de los metabolismos de ácidos grasos y aminoácidos en los pacientes con SPPT y SNPT, donde estas disfunciones en los pacientes con SPPT fueron más graves que las de los pacientes con SNPT.

Luego investigamos el efecto de clasificación para los tres grupos (pacientes SPPT, SNPT y controles) utilizando todos los indicadores de laboratorio clínico practicables (24) y DAM (96). Aquí, se excluyeron siete metabolitos relacionados con fármacos (ácido dehidroabiético, difilina, EDTA, levofloxacina, acetato de noretindrona, sunitinib y tioeteramida-PC) para aumentar la aplicabilidad general de la clasificación según la base de datos HMDB [36, 37]. Primero se aplicó el análisis de PCA para explorar si los indicadores clínicos y las DAM podían usarse para distinguir las muestras SPPT, SNPT y Control (Fig. 3): las DAM mostraron una separación obvia mientras que los indicadores clínicos mostraron una separación deficiente entre los tres grupos; los indicadores clínicos combinados con DAM mostraron el mejor desempeño de clasificación entre los tres grupos. Aquí, las diez principales variables contribuidas de PC1 y PC2 pertenecen a DAM, lo que indica una mayor contribución de DAM que de indicadores clínicos (Archivo adicional 1: Fig. S2).

Análisis de componentes principales de indicadores clínicos (A), DAM (B) y su combinación (C) entre SPPT, SNPT y controles. La clave de color indica la contribución de las 5 variables principales desde una contribución alta (flechas rojizas) hasta una contribución baja (flechas azuladas)

Las 120 funciones (24 indicadores clínicos y 96 DAM) se calcularon adicionalmente para los coeficientes de correlación entre las funciones por pares (archivo adicional 2). Se excluyeron 42 características debido a sus coeficientes de correlación absolutos medios más altos (≥ 0,7), y las 78 características restantes se denotaron como F0 para el análisis de clasificación entre los tres grupos. Luego se usaron análisis de RF y ROC para evaluar el rendimiento de clasificación de las 78 funciones para los grupos SPPT/Ctrl, SNPT/Ctrl, SPPT/SNPT y SPPT/SNPT/Ctrl. Los resultados mostraron una precisión promedio de validación cruzada de diez veces del 98 % (DE: 0,06), 100 % (DE: 0,00) y 92 % (DE: 0,09) para las clasificaciones binarias de SPPT/Ctrl, SNPT/Ctrl y SPPT/ Grupos SNPT en conjuntos de validación, respectivamente (Archivo adicional 1: Tabla S5). Además, se obtuvo una precisión del 100 % (AUC: 1,00) para todas las clasificaciones binarias de los conjuntos de prueba (Archivo adicional 1: Fig. S3). Para la clasificación de tres clases del grupo SPPT/SNPT/Ctrl, las 78 funciones también mostraron un buen desempeño de clasificación en conjuntos de validación (precisión promedio: 95 % (DE: 0,09) y conjunto de prueba (precisión: 94,74 %; sensibilidad: 80 %, 100 % y 100 % para SPPT, SNPT y grupos de control; y especificidad: 100 %, 91,67 % y 100 % para SPPT, SNPT y grupos de control; VPP: 100 %, 87,50 % y 100 % para SPPT, SNPT y grupos de control ; VPN: 93,33%, 100% y 100% para SPPT, SNPT y grupos control;) Estos indicaron la clasificación precisa entre los pacientes SPPT y SNPT y controles utilizando la combinación de indicadores clínicos y DAM (F0).

Para explorar las combinaciones optimizadas de biomarcadores de diagnóstico, luego evaluamos la contribución de las características a la clasificación utilizando un algoritmo de bosque aleatorio. Los resultados revelaron las combinaciones optimizadas de biomarcadores con mayor precisión (> 0.9, Archivo adicional 1: Fig. S4) para clasificaciones binarias y de tres clases de precisión entre los tres grupos en conjuntos de entrenamiento, incluida una combinación de dos biomarcadores (albúmina y 9-OxoODE, definida como "conjunto F1") para distinguir con precisión SPPT de los controles, una combinación de tres biomarcadores (ácido L-piroglutámico (PGA), enterostatina humana y 9-OxoODE, definida como "conjunto F2") para diferenciar con precisión SNPT de los controles, una combinación de tres combinación de biomarcadores (Val-Ser, ácido metoxiacético (MAA) y 3-hidroxibutirato de etilo, definido como "conjunto F3") para distinguir con precisión SPPT de SNPT, y una combinación de nueve biomarcadores (9-OxoODE, PGA, Val-Ser, Ethyl 3 -hidroxibutirato, MAA, enterostatina humana, DL-Norvalina, His-Pro y ácido eicosapentaenoico (EPA), definido como "conjunto F4") para la identificación precisa simultánea de pacientes y controles SPPT y SNPT (Fig. 4, Archivo adicional 1: Tabla S6).

Importancia de las características evaluadas para identificar a los pacientes SPPT, SNPT de los controles. A Importancia de las características clínicas y metabólicas de diferentes combinaciones optimizadas para una clasificación binaria precisa de los grupos SPPT/Ctrl, SNPT/Ctrl y SPPT/SNPT (de arriba a abajo) usando un modelo de bosque aleatorio. B Importancia de las características clínicas y metabólicas de las cuatro combinaciones optimizadas para la clasificación simultánea de los grupos SPPT, SNPT y Ctrl

El rendimiento de la clasificación binaria de las combinaciones de biomarcadores anteriores (F1, F2 y F3) se verificó aún más en conjuntos de pruebas con alta precisión, sensibilidad y especificidad (precisión: 83,33 % para el clasificador SPPT/Ctrl, 92,86 % para el clasificador SNPT/Ctrl, 83,33 % para clasificador SPPT/SNPT, sensibilidad: 80,00% para clasificador SPPT/Ctrl, 85,71% para clasificador SNPT/Ctrl, 80,00% para clasificador SPPT/SNPT, especificidad: 85,71% para clasificador SPPT/Ctrl, 100% para clasificador SNPT/Ctrl, 85,71 % para clasificador SPPT/SNPT; PPV: 80,00 % para clasificador SPPT/Ctrl, 100 % para clasificador SNPT/Ctrl, 80,00 % para clasificador SPPT/SNPT; VPN: 85,71 % para clasificador SPPT/Ctrl, 87,50 % para clasificador SNPT/Ctrl clasificador, 85,71% para el clasificador SPPT/SNPT; Tabla 3). En el grupo SPPT/SNPT/Ctrl, la combinación optimizada de biomarcadores (F4: 9 funciones) podría lograr una mayor precisión de clasificación de tres clases (89,47 %), sensibilidad (80 %, 85,71 % y 100 % para SPPT, SNPT y grupos de control) , especificidad (100 %, 91,67 % y 91,67 % para SPPT, SNPT y grupos de control), VPP (100 %, 85,71 % y 87,50 % para SPPT, SNPT y grupos de control) y VPN (93,33 %, 91,67 % y 100 % para grupos SPPT, SNPT y control) (fig. 5). Estos resultados demostraron un buen rendimiento de los cuatro conjuntos de características (F1–F4) para la identificación precisa de cualquiera de los pacientes y controles SPPT y SNPT.

Matrices de confusión para discriminar SPPT, SNPT y controles con F4 configurado en los conjuntos de prueba. Las matrices de confusión de izquierda a derecha muestran el rendimiento de la clasificación de los grupos SPPT/SNPT/Ctrl en los conjuntos de prueba utilizando modelos RF, SVM y MLP, respectivamente. Conjunto F4: 9-OxoODE, PGA, Val-Ser, 3-hidroxibutirato de etilo, MAA, enterostatina humana, DL-Norvalina, His-Pro y ácido eicosapentaenoico

Los otros dos métodos de aprendizaje automático (SVM y MLP) se adoptaron para verificar el rendimiento de clasificación de las cuatro combinaciones de biomarcadores mencionadas anteriormente. Como era de esperar, las cuatro combinaciones de biomarcadores anteriores mostraron una alta precisión de clasificación en los métodos SVM y MLP como en el método RF (Tabla 3, Fig. 5). Especialmente, en comparación con los métodos RF y SVM, MLP mostró el mejor rendimiento de clasificación (precisión: 94,74 %; sensibilidad: 100 %, 85,71 % y 100 % para SPPT, SNPT y grupos de control, especificidad: 100 %, 91,67 % y 100 % para SPPT, SNPT y grupos control, PPV: 100%, 100% y 87,50% para SPPT, SNPT y grupos control y VPN: 100%, 92,31% y 100% para SPPT, SNPT y grupos control) para discriminar simultáneamente SPPT y Pacientes y controles de SNPT (Fig. 5), lo que indica el potencial en la clasificación/diagnóstico de la enfermedad para MLP.

Nuestro estudio reveló un enriquecimiento significativo de lípidos/moléculas similares a lípidos y ácidos orgánicos/derivados en los pacientes SPPT y SNPT, lo que indica el metabolismo disfuncional de ácidos grasos y aminoácidos, lo cual está de acuerdo con informes anteriores [32,33,34,35] . Aquí, las muestras de SPPT mostraron una disfunción más grave en el metabolismo de los ácidos grasos y los aminoácidos. Además, se seleccionaron cuatro combinaciones prometedoras de marcadores de diagnóstico (que incluyen nueve moléculas de lípidos/similares a los lípidos y ácidos orgánicos/derivados y un indicador clínico) para la clasificación precisa de pacientes con SPPT, pacientes con SNPT y controles con alta precisión (83,33–92,86 %): una molécula similar a un lípido combinada con un indicador clínico (albúmina y 9-OxoODE) podría diferenciar con precisión a los pacientes con SPPT de los controles (precisión: 83,33 %); dos moléculas de lípidos/similares a lípidos y una de ácido orgánico (PGA, enterostatina humana y 9-oxoODE) pudieron distinguir con precisión a los pacientes con SNPT de los controles (precisión: 92,86 %); tres moléculas de ácido orgánico (Val-Ser, MAA y 3-hidroxibutirato de etilo) podrían clasificar con precisión a los pacientes con SPPT y SNPT (exactitud: 83,33 %); dos moléculas de lípidos/similares a lípidos y siete de ácidos orgánicos (9-OxoODE, PGA, Val-Ser, 3-hidroxibutirato de etilo, MAA, enterostatina humana, DL-Norvalina, His-Pro y EPA) podrían identificar simultáneamente con precisión a pacientes con SPPT, SNPT pacientes y controles (precisión: 89,47%).

Como sabemos, los lípidos/moléculas similares a lípidos son un tipo de material estructural importante de Mtb, especialmente en la pared celular bacteriana [38], que posee un rico depósito de enzimas remodeladoras de lípidos para utilizar los ácidos grasos del huésped para su supervivencia en las duras condiciones ambientales. microambiente hipóxico [39], lo que resulta en un metabolismo de lípidos gravemente disfuncional en pacientes con tuberculosis [40]. Para el metabolismo de los aminoácidos, dado que la TB es una enfermedad consuntiva crónica, varios tipos de aminoácidos y proteínas son esenciales para que la Mtb sobreviva en el cuerpo humano, lo que lleva al metabolismo disfuncional de los aminoácidos en los pacientes con TB [32]. Como era de esperar, nuestro estudio identificó algunos metabolitos de lípidos y aminoácidos significativamente diferenciales (regulados hacia arriba/abajo) para discriminar con precisión a los pacientes con SPPT, pacientes con SNPT y controles a través de métodos de aprendizaje automático. Ciertamente, estos marcadores y paneles justifican una mayor confirmación y optimización con estudios de mayor tamaño de muestra.

Las nueve moléculas de lípidos/similares a lípidos y ácidos orgánicos/derivados de cuatro posibles combinaciones de biomarcadores de diagnóstico incluyen dos moléculas de lípidos/similares a lípidos (9-OxoODE y EPA) y siete ácidos orgánicos/derivados (PGA, DL-Norvalina, MAA, His-Pro, Val-Ser, Ethyl 3-hydroxybutyrate y Enterostatin human) (Archivos adicionales 3, 4, 5).

En primer lugar, las dos moléculas de lípido/similares a lípidos muestran una inhibición/regulación a la baja significativa en los pacientes con SPPT y SNPT (Archivo adicional 1: Fig. S5). Aquí, 9-OxoODE ocupa el primer lugar, el primero y el tercero en los biomarcadores de clasificación para los grupos SPPT/Ctrl, SPPT/SNPT/Ctrl y SNPT/Ctrl, respectivamente (Fig. 4). Un estudio previo ha demostrado que el 9-OxoODE significativamente inhibido también refleja una regulación negativa para la respuesta inflamatoria inducida por lipólisis en pacientes SPPT y SNPT, ya que el 9-OxoODE (metabolito del ácido linoleico) puede activar la maquinaria lipogénica como receptor nuclear ligando en PPAR -α y PPAR-γ [41,42,43,44]. Otra molécula lipídica/similar a los lípidos, la EPA ocupa el séptimo lugar en la clasificación de biomarcadores para SPPT/SNPT/Ctrl (Fig. 4). Estudios anteriores han informado que la EPA significativamente regulada a la baja puede dar lugar a respuestas inflamatorias disfuncionales en pacientes con TB al regular a la baja las citocinas proinflamatorias y al aumentar la síntesis de lípidos de las células inmunitarias [45].

Para los siete ácidos/derivados orgánicos mencionados anteriormente como posibles biomarcadores de clasificación, en comparación con los controles, tres (PGA, MAA y DL-Norvalina) muestran una regulación negativa significativa y His-Pro muestra una regulación positiva significativa tanto en pacientes con SPPT como con SNPT (Archivo adicional 1: Fig. . S5). Aquí, PGA ocupa el primer y cuarto lugar en los biomarcadores de clasificación para los grupos SNPT/Ctrl y SPPT/SNPT/Ctrl, respectivamente (Fig. 4). Se ha informado que la PGA significativamente regulada a la baja mejora el crecimiento de Mtb al inhibir la biosíntesis de glutatión en los cuerpos humanos [46,47,48,49]. MAA ocupa el tercer y quinto lugar entre los biomarcadores de clasificación para los grupos SPPT/SNPT y SPPT/SNPT/Ctrl, respectivamente (Fig. 4). MAA significativamente regulado a la baja podría dar como resultado una inhibición deficiente de mPTPB esencial para la supervivencia de Mtb, ya que se ha demostrado que cataliza la formación de un inhibidor de una proteína de Mycobacterium (tirosina fosfatasa B: mPTPB) [50]. Además, DL-Norvaline y His-Pro ocupan el octavo y el noveno lugar entre los biomarcadores de clasificación para el grupo SPPT/SNPT/Ctrl (Fig. 4), los cuales mostraron tendencias expresadas similares, lo que sugiere la disfunción tanto en pacientes con SPPT como con SNPT.

Las tres moléculas biomarcadoras de ácidos orgánicos restantes (Val-Ser, 3-hidroxibutirato de etilo y enterostatina humana) muestran un enriquecimiento diferencial entre los pacientes con SPPT y SNPT. Aquí, Val-Ser y 3-hidroxibutirato de etilo se muestran específicamente regulados a la baja y al alza en pacientes con SPPT, respectivamente (Archivo adicional 1: Fig. S5). Clasifican el primero y segundo entre las características para la diferenciación del grupo SPPT/SNPT, y clasifican el tercero y segundo entre las características para la diferenciación del grupo SPPT/SNPT/Ctrl, respectivamente (Fig. 4). La "enterostatina humana" se reguló específicamente en pacientes con SNPT y ocupa el segundo y sexto lugar entre las características seleccionadas para la diferenciación de los grupos SNPT/Ctrl y SPPT/SNPT/Ctrl, respectivamente (Fig. 4). Los tres ácidos/derivados orgánicos con cambios específicos en un solo grupo muestran una característica única para la clasificación de varios tipos de pacientes con TB.

Además, un indicador clínico de albúmina ocupa el segundo lugar en el conjunto de características para la diferenciación del grupo SPPT/Ctrl, lo que indica una mejor precisión en el diagnóstico de los pacientes con SPPT mediante la combinación del metaboloma y los indicadores clínicos (Fig. 4). Informes anteriores han indicado un marcador de pronóstico de pacientes con TB para la albúmina, que es un nutriente crítico y un marcador de proteína relacionado con la inflamación [51].

Nuestro hallazgo muestra aún más el potencial del aprendizaje automático en el diagnóstico preciso de pacientes con SPPT y SNPT. El aprendizaje automático se está volviendo omnipresente para analizar big data multidimensional y se ha aplicado ampliamente a muchos campos biológicos/médicos, incluida la identificación de biomarcadores de diagnóstico [52], la detección de objetivos terapéuticos [53], la predicción de la progresión de la enfermedad [54] y la relación causal. entre fenotipo y genotipo [55]. En nuestro estudio, se utilizan tres métodos de aprendizaje automático para descartar biomarcadores potenciales para una clasificación precisa de varios tipos de TB a partir de datos multidimensionales. RF se adoptó por primera vez para descartar biomarcadores de clasificación precisos, ya que se ha aplicado ampliamente a la clasificación y selección de características para big data; luego obtuvimos algunas características importantes de clasificación según los rangos de las variables y su importancia predictiva. Estudios previos también han demostrado el buen rendimiento del método RF para discriminar la TB de la no TB [56]. Los otros dos métodos de aprendizaje automático (SVM y MLP) se utilizaron además para verificar la precisión de la clasificación de las combinaciones de biomarcadores. SVM es un conjunto de aprendizaje automático para mejorar el rendimiento de la clasificación en comparación con un solo clasificador, que también se ha aplicado en la predicción de la progresión de enfermedades como el cáncer de mama [57]. MLP es muy famoso por su capacidad de aprendizaje autonómico sin el requisito de conocimientos previos, que también se ha utilizado en el diagnóstico de TB [58] y la evaluación del riesgo pronóstico para pacientes con SNPT [59]. Nuestra investigación indicó el mejor rendimiento de clasificación de MLP para identificar simultáneamente SPPT, SNPT y controles, con la precisión más alta del 94,74 %, lo que sugiere la ventaja de MLP sobre RF y SVM hasta cierto punto.

También hay algunas limitaciones en nuestro estudio. Aunque hemos incluido a todos los pacientes con tuberculosis que cumplieron con los criterios de inclusión y exclusión en los tres hospitales durante 2017-2018 (el Instituto de Prevención y Tratamiento de la Tuberculosis de Kashgar, el Segundo Hospital Popular de Aksu y el Hospital de Enfermedades Infecciosas del Condado de Kuqa), esto es de hecho, una limitación de nuestro estudio por no calcular el tamaño de muestra necesario como encuesta epidemiológica. Los conjuntos de prueba y entrenamiento relativamente pequeños pueden disminuir el poder estadístico de los resultados, y este punto justifica una mayor confirmación y optimización con estudios de mayor tamaño de muestra en el futuro. Además, no observamos el impacto de los factores demográficos (edad, ocupación, IMC, etc.) en los perfiles metabolómicos (datos no mostrados), pero también se justifica una mayor confirmación con muestras más grandes. Ciertamente, para traducir nuestro modelo de clasificación a la práctica clínica, todavía se requieren muchos trabajos estandarizados sobre datos/flujo de trabajo/muestreo. En general, todos los clasificadores binarios y de tres clases obtenidos de nuestro estudio mostraron un buen rendimiento para identificar con precisión los grupos SPPT, SNPT y Ctrl a pesar de algunas limitaciones, y también se ha informado que algunos biomarcadores de clasificación están estrechamente asociados con la TB [45, 49, 50].

Nuestro estudio actual no solo selecciona cuatro combinaciones de biomarcadores para la detección precisa de pacientes con SPPT y SNPT mediante la combinación de metabolitos plasmáticos con indicadores clínicos, sino que también muestra una aplicación prometedora del aprendizaje automático en la identificación de biomarcadores de diagnóstico a partir de macrodatos multidimensionales.

En las últimas décadas, a pesar del rápido avance de varias tecnologías de diagnóstico, los errores de diagnóstico (diagnósticos perdidos, retrasados ​​o erróneos) siguen siendo los problemas más comunes para muchas enfermedades importantes, como el cáncer de pulmón [52]. La multiómica y el aprendizaje automático proporcionan herramientas poderosas para resolver estos problemas, y los investigadores pueden lograr clasificaciones/diagnósticos precisos para las enfermedades mal diagnosticadas mediante la integración de datos multiómicos con el aprendizaje automático [15, 18, 52]. Nuestra investigación presenta un intento exitoso de detectar con precisión varios tipos de TB mediante la integración de datos multiómicos con el aprendizaje automático y, además, proporciona un buen ejemplo y flujo de trabajo para futuros estudios sobre el diagnóstico de precisión de varias enfermedades mal diagnosticadas.

Todos los datos generados o analizados durante este estudio se incluyen en este artículo publicado y sus archivos de información complementarios, las consultas adicionales pueden dirigirse a los autores correspondientes. Los datos de metabolómica se han depositado en la base de datos EMBL-EBI MetaboLights con el identificador MTBLS3787 [60]. Los datos y el código utilizados para el análisis de este estudio están disponibles en GitHub (https://github.com/ChenF-Lab/SPPT.git).

controlar a la gente

Validación cruzada

Metabolitos diferencialmente abundantes

ácido eicosapentaenoico

Velocidad de sedimentación globular

Rango intercuartil

K-vecino más cercano

Ácido metoxiacético

Disminución media del coeficiente de Gini

Red neuronal perceptrón multicapa

Tuberculosis micobacteriana

Análisis discriminante de mínimos cuadrados parciales ortogonales

Análisis de componentes principales

Ácido L-piroglutámico

Bosque aleatorio

Tuberculosis pulmonar con frotis negativo

Característica Operativa del Receptor

Tuberculosis pulmonar con frotis positivo

Máquinas de vectores de soporte

Tuberculosis

Importancia variable en la proyección

Organización Mundial de la Salud. Informe mundial sobre la tuberculosis 2021. Ginebra: Organización Mundial de la Salud; 2021. https://www.who.int/teams/global-tuberculosis-programme/data.

Bussi C, Gutiérrez MG. Infección por Mycobacterium tuberculosis de células huésped en el espacio y el tiempo. FEMS Microbiol Rev. 2019;43(4):341–61.

Artículo CAS PubMed PubMed Central Google Scholar

Huang H, Ding N, Yang T, Li C, Jia X, Wang G, et al. Secuenciación transversal del genoma completo y estudio epidemiológico de Mycobacterium tuberculosis resistente a múltiples fármacos en China. Clin Infect Dis. 2019;69(3):405–13.

Artículo CAS PubMed Google Académico

Tusun D, ​​Abulimiti M, Mammoth X, Liu Z, Xu D, Li G, et al. Las características epidemiológicas de la tuberculosis pulmonar: prefectura de Kashgar, región autónoma de Xinjiang Uygur, China, 2011–2020. Semanal de los CDC de China. 2021;3(26):557–61.

Artículo PubMed PubMed Central Google Académico

Lv L, Li C, Zhang X, Ding N, Cao T, Jia X, et al. Análisis de perfiles de ARN de los exosomas séricos derivados de pacientes con infección activa y latente por Mycobacterium tuberculosis. Microbiol frontal. 2017;8:1051.

Artículo PubMed PubMed Central Google Académico

Zhang G, Zhang L, Zhang M, Pan L, Wang F, Huang J, et al. Detección y evaluación de 11 proteínas de Mycobacterium tuberculosis como posibles marcadores de serodiagnóstico para discriminar a los pacientes con TB de los vacunados con BCG. Genoma Proteoma Bioinf. 2009;7(3):107–15.

Artículo CAS Google Académico

Campos LC, Rocha MV, Willers DM, Silva DR. Características de los pacientes con tuberculosis (TB) pulmonar con baciloscopía negativa en una región con alta prevalencia de TB y VIH. Más uno. 2016;11(1): e0147933.

Artículo PubMed PubMed Central CAS Google Scholar

Steingart KR, Ng V, Henry M, Hopewell PC, Ramsay A, Cunningham J, et al. Métodos de procesamiento de esputo para mejorar la sensibilidad de la microscopía de frotis para la tuberculosis: una revisión sistemática. Lancet Infect Dis. 2006;6(10):664–74.

Artículo PubMed Google Académico

Chakaya J, Khan M, Ntoumi F, Aklillu E, Fatima R, Mwaba P, et al. Informe mundial sobre tuberculosis 2020: reflexiones sobre la carga mundial de tuberculosis, el tratamiento y los esfuerzos de prevención. Int J Infect Dis. 2021;113:S7

Artículo CAS PubMed PubMed Central Google Scholar

Dorman SE, Schumacher SG, Alland D, Nabeta P, Armstrong DT, King B, et al. Xpert MTB/RIF ultra para la detección de Mycobacterium tuberculosis y resistencia a la rifampicina: un estudio prospectivo multicéntrico de precisión diagnóstica. Lancet Infect Dis. 2018;18(1):76–84.

Artículo CAS PubMed PubMed Central Google Scholar

Getahun H, Harrington M, O'Brien R, Nunn P. Diagnóstico de tuberculosis pulmonar con baciloscopía negativa en personas con infección por VIH o SIDA en entornos con recursos limitados: informando cambios de política urgentes. Lanceta. 2007;369(9578):2042–9.

Artículo PubMed Google Académico

Boehme CC, Nabeta P, Hillemann D, Nicol MP, Shenai S, Krapp F, et al. Detección molecular rápida de tuberculosis y resistencia a rifampicina. N Engl J Med. 2010;363(11):1005–15.

Artículo CAS PubMed PubMed Central Google Scholar

Olivier M, Asmis R, Hawkins GA, Howard TD, Cox LA. La necesidad de firmas de biomarcadores multiómicos en medicina de precisión. Int J Mol Sci. 2019;20(19):4781.

Artículo CAS PubMed Central Google Académico

Wang E, Cho WCS, Wong SCC, Liu S. Biomarcadores de enfermedades para la medicina de precisión: desafíos y oportunidades futuras. Genoma Proteoma Bioinf. 2017;15(2):57–8.

Artículo Google Académico

Liu L, Wu J, Shi M, Wang F, Lu H, Liu J et al. Nuevas alteraciones metabólicas y marcador predictivo de ácido pipecólico en sueros para carcinoma de células escamosas de esófago. Genoma Proteoma Bioinf. 2022.

Li Y, Chen L. Grandes datos biológicos: desafíos y oportunidades. Genoma Proteoma Bioinf. 2014;12(5):187–9.

Artículo Google Académico

German JB, Bauman DE, Burrin DG, Failla ML, Freake HC, King JC, et al. La metabolómica en la primera década del siglo XXI: construyendo los caminos hacia la salud individualizada. J Nutr. 2004;134(10):2729–32.

Artículo CAS PubMed Google Académico

Deng J, Liu L, Yang Q, Wei C, Zhang H, Xin H, et al. Análisis metabolómico urinario para identificar marcadores potenciales para el diagnóstico de tuberculosis y tuberculosis latente. Arch Biochem Biophys. 2021;704: 108876.

Artículo CAS PubMed Google Académico

Huang H, Shi LY, Wei LL, Han YS, Yi WJ, Pan ZW, et al. Metabolitos plasmáticos xantina, 4-piridoxato y ácido d-glutámico como nuevos biomarcadores potenciales para la tuberculosis pulmonar. Clin Chim Acta. 2019;498:135–42.

Artículo CAS PubMed Google Académico

Sun L, Li JQ, Ren N, Qi H, Dong F, Xiao J, et al. Utilidad de nuevos marcadores metabólicos plasmáticos en el diagnóstico de tuberculosis pediátrica: un enfoque de análisis de árbol de clasificación y regresión. J Proteoma Res. 2016;15(9):3118–25.

Artículo CAS PubMed Google Académico

Pang Z, Chong J, Zhou G, de Lima Morais DA, Chang L, Barrette M, et al. MetaboAnalyst 5.0: reduciendo la brecha entre los espectros sin procesar y los conocimientos funcionales. Ácidos Nucleicos Res. 2021;49(W1):W388–96.

Artículo CAS PubMed PubMed Central Google Scholar

Pan R, Yang T, Cao J, Lu K, Zhang ZC, et al. Imputación de datos faltantes por K vecinos más cercanos basada en estructura relacional gris e información mutua. Inteligencia de aplicación 2015;43:614–32.

Artículo Google Académico

Abdi H, Williams LJ. Análisis de componentes principales. Wiley Interdiscip Rev Comput Stat. 2010;2:433–59.

Artículo Google Académico

Bewick V, Cheek L, Ball J. Revisión estadística 13: curvas características operativas del receptor. Cuidado crítico. 2004;8:508.

Artículo PubMed PubMed Central Google Académico

Breiman L. Bosques aleatorios. Aprender Mach. 2001; 45:5–32.

Artículo Google Académico

Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C, et al. Tensor flow: aprendizaje automático a gran escala en sistemas heterogéneos. 2015. Disponible en línea en: tensorflow.org.

Palaci M, Dietze R, Hadad DJ, Ribeiro FK, Peres RL, Vinhas SA, et al. Enfermedad cavitaria y carga bacilar cuantitativa del esputo en casos de tuberculosis pulmonar. J. Clin Microbiol. 2007;45(12):4064–6.

Artículo PubMed PubMed Central Google Académico

Kang W, Wu M, Yang K, Ertai A, Wu S, Geng S, et al. Factores asociados con resultados negativos de T-SPOT.TB entre pacientes con tuberculosis con frotis negativo en China. Sci Rep. 2018;8(1):4236.

Artículo PubMed PubMed Central CAS Google Scholar

Nakao M, Muramatsu H, Arakawa S, Sakai Y, Suzuki Y, Fujita K, et al. Estado inmunonutricional y cavitación pulmonar en pacientes con tuberculosis: una revisión con una evaluación de la relación neutrófilos/linfocitos. Respir Investig. 2019;57(1):60–6.

Artículo PubMed Google Académico

Berhane M, Melku M, Amsalu A, Enawgaw B, Getaneh Z, Asrie F. El papel de la proporción de recuento de neutrófilos y linfocitos en el diagnóstico diferencial de la tuberculosis pulmonar y la neumonía adquirida en la comunidad bacteriana: un estudio transversal en los hospitales Ayder y Mekelle , Etiopía. Clin Lab 2019, 65(4).

Shvets OM, Shevchenko OS, Todoriko LD, Shevchenko RS, Yakimets VV, Choporova OI, et al. Perfiles metabólicos de carbohidratos y lípidos de pacientes con tuberculosis con lesiones pulmonares bilaterales y excreción de micobacterias. Wiad Lek. 2020;73(7):1373–6.

Artículo PubMed Google Académico

Zhang P, Zhang W, Lang Y, Qu Y, Chen J, Cui L. Perfil metabólico del líquido cefalorraquídeo basado en resonancia magnética nuclear 1H para identificar características metabólicas y marcadores de meningitis tuberculosa. Infect Genet Evol. 2019;68:253–64.

Artículo CAS PubMed Google Académico

Collins JM, Walker DI, Jones DP, Tukvadze N, Liu KH, Tran VT, et al. Análisis de metabolómica de plasma de alta resolución para detectar metabolitos asociados a Mycobacterium tuberculosis que distinguen la tuberculosis pulmonar activa en humanos. Más uno. 2018;13(10): e0205398.

Artículo PubMed PubMed Central CAS Google Scholar

Frediani JK, Jones DP, Tukvadze N, Uppal K, Sanikidze E, Kipiani M, et al. Metabolómica del plasma en la enfermedad de tuberculosis pulmonar humana: un estudio piloto. Más uno. 2014;9(10): e108854.

Artículo PubMed PubMed Central CAS Google Scholar

Zhou A, Ni J, Xu Z, Wang Y, Lu S, Sha W, et al. Aplicación de metabolómica basada en espectroscopia (1)h RMN a sueros de pacientes con tuberculosis. J Proteoma Res. 2013;12(10):4642–9.

Artículo CAS PubMed Google Académico

[ PubMed ] Kim E, Kang YG, Kim YJ, Lee TR, Yoo BC, Jo M, et al. El ácido dehidroabiético suprime la respuesta inflamatoria a través de la supresión de las vías mediadas por Src, Syk y TAK1. Int J Mol Sci. 2019;20(7):1593.

Artículo CAS PubMed Central Google Académico

Kartha S, Yan L, Ita ME, Amirshaghaghi A, Luo L, Wei Y, et al. Las micelas de fosfolípidos cargadas con inhibidores de la fosfolipasa A2 eliminan el dolor neuropático. ACS Nano. 2020;14(7):8103–15.

Artículo CAS PubMed PubMed Central Google Scholar

Jankute M, Cox JA, Harrison J, Besra GS. Montaje de la pared celular de micobacterias. Annu Rev Microbiol. 2015;69:405–23.

Artículo CAS PubMed Google Académico

Srivastava S, Chaudhary S, Thukral L, Shi C, Gupta RD, Gupta R, et al. La asimilación de lípidos insaturados por parte de las micobacterias requiere isomerasa cis-trans enoil CoA auxiliar. Química Biol. 2015;22(12):1577–87.

Artículo CAS PubMed Google Académico

Mu J, Yang Y, Chen J, Cheng K, Li Q, Wei Y, et al. Metabolismo elevado de los lípidos del huésped revelado por el análisis proteómico cuantitativo basado en iTRAQ del líquido cefalorraquídeo de pacientes con meningitis tuberculosa. Biochem Biophys Res Comun. 2015;466(4):689–95.

Artículo CAS PubMed Google Académico

Goto T, Lee JY, Teraminami A, Kim YI, Hirai S, Uemura T, et al. La activación del receptor alfa activado por el proliferador de peroxisomas estimula tanto la diferenciación como la oxidación de ácidos grasos en los adipocitos. Res. de lípidos J. 2011;52(5):873–84.

Artículo CAS PubMed PubMed Central Google Scholar

Andrés Contreras G, De Koster J, de Souza J, Laguna J, Mavangira V, Nelli RK, et al. La lipólisis modula la biosíntesis de mediadores lipídicos inflamatorios derivados del ácido linoleico en tejido adiposo de vacas lecheras periparto. J ciencia lechera. 2020;103(2):1944–55.

Artículo CAS PubMed Google Académico

Armstrong MM, Díaz G, Kenyon V, Holman TR. Investigaciones inhibitorias y mecanicistas de oxo-lípidos con isoenzimas de lipoxigenasa humana. Bioorg Med Chem. 2014;22(15):4293–7.

Artículo CAS PubMed PubMed Central Google Scholar

Mattmiller SA, Carlson BA, Gandy JC, Sordillo LM. La expresión reducida de selenoproteína de macrófagos altera la biosíntesis de metabolitos de lípidos oxidados a partir de ácido araquidónico y linoleico. J Nutr Biochem. 2014;25(6):647–54.

Artículo CAS PubMed Google Académico

Nienaber A, Baumgartner J, Dolman RC, Ozturk M, Zandberg L, Hayford FEA, et al. Los suplementos de hierro y ácidos grasos omega-3 solos, pero no en combinación, reducen la inflamación y la anemia de la infección en ratones infectados con Mycobacterium tuberculosis. Nutrientes. 2020;12(9):2897.

Artículo CAS PubMed Central Google Académico

Orlowski M, Meister A. El ciclo gamma-glutamil: un posible sistema de transporte de aminoácidos. Proc Natl Acad Sci US A. 1970;67(3):1248–55.

Artículo CAS PubMed PubMed Central Google Scholar

Gamarra Y, Santiago FC, Molina-Lopez J, Castano J, Herrera-Quintana L, Dominguez A, et al. Pyroglutamic acidosis by glutathione regeneration blockage in critical patients with septic shock. Crit Care. 2019;23(1):162.

Artículo PubMed PubMed Central Google Académico

Balazy M, Kaminski PM, Mao K, Tan J, Wolin MS. S-Nitroglutatión, producto de la reacción entre peroxinitrito y glutatión que genera óxido nítrico. J Biol Chem. 1998;273(48):32009–15.

Artículo CAS PubMed Google Académico

Ly J, Lagman M, Saing T, Singh MK, Tudela EV, Morris D, et al. La suplementación con glutatión liposomal restaura la respuesta de citocinas TH1 a la infección por Mycobacterium tuberculosis en personas infectadas por el VIH. J Interferon Cytokine Res. 2015;35(11):875–87.

Artículo CAS PubMed PubMed Central Google Scholar

He R, Zeng LF, He Y, Wu L, Gunawan AM, Zhang ZY. Reacción organocatalítica multicomponente para la adquisición de un inhibidor selectivo de mPTPB, un factor de virulencia de la tuberculosis. Chem Commun (Camb). 2013;49(20):2064–6.

Artículo CAS Google Académico

Fu YR, Yi ZJ, Guan SZ, Zhang SY, Li M. Análisis proteómico del esputo en pacientes con tuberculosis pulmonar activa. Clin Microbiol Infect. 2012;18(12):1241–7.

Artículo CAS PubMed Google Académico

Zhang J, Han X, Gao C, Xing Y, Qi Z, Liu R, et al. 5-hidroximetiloma en el ADN circulante libre de células como biomarcador potencial para el cáncer de pulmón de células no pequeñas. Genoma Proteoma Bioinf. 2018;16(3):187–99.

Artículo CAS Google Académico

Riniker S, Wang Y, Jenkins JL, Landrum GA. Uso de información de pantallas históricas de alto rendimiento para predecir compuestos activos. Modelo J Chem Inf. 2014;54(7):1880–91.

Artículo CAS PubMed Google Académico

Wang J, Xie X, Shi J, He W, Chen Q, Chen L, et al. El autocodificador de eliminación de ruido, un algoritmo de aprendizaje profundo, ayuda a identificar una nueva firma molecular de adenocarcinoma de pulmón. Genoma Proteoma Bioinf. 2020;18(4):468–80.

Artículo Google Académico

Akkasi A, Moens MF. Extracción de relaciones causales del texto biomédico utilizando modelos neuronales profundos: una encuesta exhaustiva. J Biomed Informar. 2021;119: 103820.

Artículo PubMed Google Académico

Yang Q, Chen Q, Zhang M, Cai Y, Yang F, Zhang J, et al. Identificación de biofirma de ocho proteínas para el diagnóstico de tuberculosis. Tórax. 2020;75(7):576–83.

Artículo PubMed Google Académico

Huang MW, Chen CW, Lin WC, Ke SW, Tsai CF. Conjuntos SVM y SVM en la predicción del cáncer de mama. Más uno. 2017;12(1): e0161501.

Artículo PubMed PubMed Central CAS Google Scholar

Er O, Temurtas F, Tanrikulu AC. Diagnóstico de la enfermedad de la tuberculosis mediante redes neuronales artificiales. J Med Syst. 2010;34(3):299–302.

Artículo PubMed Google Académico

de Souza Filho JBO, de Seixas JM, Galliez R, de Braganca Pereira B, de Mello FCQ, Dos Santos AM, et al. Un sistema de detección de tuberculosis pulmonar con frotis negativo utilizando redes neuronales artificiales. Int J Infect Dis. 2016;49:33–9.

Artículo Google Académico

Haug K, Cochrane K, Nainala VC, Williams M, Chang J, Jayaseelan KV, et al. MetaboLights: un recurso que evoluciona en respuesta a las necesidades de su comunidad científica. Ácidos Nucleicos Res. 2020;48(D1):D440–4.

CAS PubMed Google Académico

Descargar referencias

Los autores desean agradecer a todos los participantes del estudio que contribuyeron a este trabajo, así como al personal de investigación clínica de las instituciones participantes, que hicieron posible esta investigación.

Esta investigación fue financiada por el Laboratorio Estatal Clave de Patogénesis, Prevención y Tratamiento de Enfermedades de Alta Incidencia en Asia Central, Universidad Médica de Xinjiang (Subvención No. SKL-HIDCA-2021-JH10, SKL-HIDCA-2020-38, SKL-HIDCA-2020 -36 y SKL-HIDCA-2020-35), Proyecto especial de ciencia y tecnología principal en la región autónoma de Xinjiang Uygur (Subvención No. 2017A03006-2), Fundación Nacional de Ciencias Naturales de China (NSFC) (Subvención No. 82060609), Fondos para Cooperación e intercambio internacional de la Fundación Nacional de Ciencias Naturales de China (Subvención No. 32061143024), Proyecto clave de investigación y desarrollo en la provincia de Hainan (ZDYF2021SHFZ228).

Xin Hu, Jie Wang, Yingjiao Ju y Xiuli Zhang contribuyeron igualmente a este trabajo.

Laboratorio Estatal Clave de Patogénesis, Prevención y Tratamiento de Enfermedades de Alta Incidencia en Asia Central, Departamento de Medicina Respiratoria, Primer Hospital Afiliado de la Universidad Médica de Xinjiang, Urumqi, 830000, Xinjiang, China

Xin Hu y Jing Wang

Departamento de Medicina Respiratoria, Primer Hospital Afiliado de la Universidad Médica de Xinjiang, Urumqi, 830011, Xinjiang, China

Xin Hu

CAS Key Laboratory of Genome Sciences and Information, Instituto de Genómica de Beijing, Academia de Ciencias de China y Centro Nacional de Bioinformación de China, Beijing, 100101, China

Jie Wang, Yingjiao Ju, Xiuli Zhang, Cuidan Li, Liya Yue y Fei Chen

Universidad de la Academia China de Ciencias, Beijing, 100049, China

Jie Wang, Yingjiao Ju y Fei Chen

Departamento de Medicina Respiratoria, Segundo Hospital Afiliado de la Universidad Médica de Xinjiang, Urumqi, 830063, Xinjiang, China

Wushou'er Qimanguli

Laboratorio Estatal Clave de Patogénesis, Prevención y Tratamiento de Enfermedades de Alta Incidencia en Asia Central, Urumqi, 830011, Xinjiang, China

Bahetibieke Tuohetaerbaike, Ying Li, Hao Wen, Wenbao Zhang y Fei Chen

Laboratorio Clave de Virología Molecular e Inmunología, Unidad de Infección por Hongos Patógenos e Inmunidad del Huésped, Instituto Pasteur de Shanghái, Academia de Ciencias de China, Shanghái, 20003, China

changbin chen

Departamento de Medicina Respiratoria, Segundo Hospital Afiliado de la Universidad Médica de Hainan Haikou, Hainan, 570100, China

Yefeng Yang y Jing Wang

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

FC, JingW, HW y WBZ contribuyeron a la concepción y el diseño del estudio JieW, JYJ y XLZ realizaron los análisis bioinformáticos XH, BT, YL, YFY y CBC recolectaron muestras de sangre XH, JieW, JYJ, XLZ, CDL y YLY dibujó las figuras FC, JingW, XH, JieW, JYJ, XLZ y QW escribieron el manuscrito Todos los autores leyeron y aprobaron el manuscrito final.

Correspondencia a Jing Wang o Fei Chen.

Este estudio fue aprobado por el Comité de Ética del Primer Hospital Afiliado de la Universidad Médica de Xinjiang (Número de registro 20171123-06-1908A) y el proyecto fue apoyado por el Centro Médico Clínico de la Provincia de Hainan. Todos los sujetos inscritos dieron su consentimiento informado por escrito. Todos los métodos se realizaron de acuerdo con las directrices y normativas pertinentes.

No aplica.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Dato suplementario.

Matriz de correlación de 120 características.

Información detallada de las 70 DAM entre los pacientes SPPT y los controles.

Información detallada de los 79 DAM entre los pacientes y controles del SNPT.

Información detallada de los 33 DAM entre los pacientes SPPT y SNPT.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. La renuncia de Creative Commons Public Domain Dedication (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.

Reimpresiones y permisos

Hu, X., Wang, J., Ju, Y. et al. La combinación del metaboloma y los indicadores clínicos con el aprendizaje automático proporciona algunos marcadores de diagnóstico prometedores para detectar con precisión la tuberculosis pulmonar con frotis positivo/negativo. BMC Infect Dis 22, 707 (2022). https://doi.org/10.1186/s12879-022-07694-8

Descargar cita

Recibido: 07 enero 2022

Aceptado: 22 de agosto de 2022

Publicado: 25 agosto 2022

DOI: https://doi.org/10.1186/s12879-022-07694-8

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt