O conteúdo desse portal pode ser acessível em Libras usando o VLibras

Classificação de Gravidade e Identificação de Biomarcadores na COVID-19: Análise do Exoma de Pacientes através de Máquinas de Vetores de Suporte com Kernel Linear (SVM)

Nome: ALÉXIA STEFANI SIQUEIRA ZETUM

Data de publicação: 24/02/2025

Banca:

Nomeordem decrescente Papel
DEBORA DUMMER MEIRA Coorientador
ELIZEU FAGUNDES DE CARVALHO Examinador Externo
FLAVIA DE PAULA Examinador Interno
IURI DRUMOND LOURO Presidente

Resumo: Introdução: A infecção por SARS-CoV-2 apresenta um amplo espectro de manifestações clínicas. Variações genéticas podem influenciar a resposta do hospedeiro ao vírus. O uso de Machine learning (ML) tem se mostrado promissor na identificação de biomarcadores genéticos e de indivíduos que possam desenvolver a forma mais grave da doença. Objetivo: Desenvolver um modelo de ML com dados de exoma para prever desfechos clínicos em pacientes com COVID-19 e identificar genes que possam estar associados à gravidade da doença. Metodologia: A pesquisa envolveu dados de 239 pacientes com COVID-19 (“Não grave” e “Grave”). O sequenciamento de DNA foi realizado e uma análise de ancestralidade foi conduzida. Um modelo de Máquinas de Vetores de Suporte (SVM) com kernel linear foi desenvolvido para prever a gravidade da COVID-19, com o uso de Recursive Feature Elimination (RFE) para selecionar as variantes mais influentes. Métricas como Area Under the Curve-Receiver Operating Characteristic (AUC-ROC), precisão, F1 score, sensibilidade e especificidade foram usados. Posteriormente, uma análise de
regressão logística (RL) com as variantes selecionadas pelo SVM-RFE e variáveis de confusão foi realizada. Resultados e Discussão: O modelo SVM com kernel linear apresentou um AUC-ROC de 0,81, precisão de 83%, e F1 score de 0,78, o que indica uma boa capacidade de discriminação entre casos “Graves” e “Não graves” de COVID-19. Foram selecionadas 15 variantes pelo modelo, das quais sete mostraram-se significativamente associadas à gravidade da doença na RL. As variantes de risco incluem WSCD1 (rs2302837 “A/A” ou “A/G”, IC 95% 1,32-7,24, OR: 3,09, P<0,01), PTPRS (rs1143700 “A/A” ou “A/G”, IC 95% 1,54-7,07, OR: 3,30, P <0,01), ARVCF (rs2073744 “A/A” ou “A/G”, IC 95% 1,31-6,30, OR: 2,88, P<0,01) e LVRN (rs10078759 “G/G” ou “G/C”, IC 95% 1,07-4,31, OR: 2,08, P=0,04). Por outro lado, variantes protetoras incluem ALDH4A1 (rs6426813 “G/G” ou “G/A”, IC 95% 0,23-0,93, OR: 0,48, P=0,02), ARHGAP22 (rs10776601 “C/C” ou “C/T”, IC 95% 0,09-0,56, OR: 0,23, P<0,01) e C3 (rs423490 “A/A” ou “A/G”, IC 95% 0,14-0,70, OR: 0,32, P<0,01). A análise dos resultados mostrou que o SVM com kernel linear é eficaz na previsão da gravidade da COVID-19 com dados do exoma. A análise da rede de interação proteína-proteína (PPI) identificou vias biológicas associadas ao sistema imune, resposta inflamatória e coagulação sanguínea. Genes como C3, PTPRS e LVRN se destacaram em funções relacionadas à regulação da resposta imune e à modulação da inflamação, sugerindo que estas vias estão ligadas diretamente ao desfecho ruim na COVID-19. A rede também revelou a interconexão entre processos de sinalização celular e mecanismos de resposta ao estresse, o que pode explicar a variabilidade na resposta clínica observada entre os pacientes. Conclusão: SVM com kernel linear com nossos dados, mostrou-se eficaz na previsão da gravidade da COVID-19. Este estudo destaca a importância de abordagens integrativas para melhor entendimento da doença. A identificação de biomarcadores genéticos pode auxiliar no tratamento e na gestão de futuras pandemias.

Acesso ao documento

Acesso à informação
Transparência Pública

© 2013 Universidade Federal do Espírito Santo. Todos os direitos reservados.
Av. Marechal Campos, 1468 - Bonfim, Vitória - ES | CEP 29047-105

Conteúdo acessível em Libras usando o VLibras Widget com opções dos Avatares Ícaro, Hosana ou Guga. Conteúdo acessível em Libras usando o VLibras Widget com opções dos Avatares Ícaro, Hosana ou Guga.