Ensemble de especialistas para avaliação de adesão ao procedimento operacional padrão de fotografias de radiografias de tórax Cecília Aparecida Santos Silva Departamento de Automática Universidade Federal de Lavras Lavras, Brasil cecilia.silva1@estudante.ufla.br José Manoel de Seixas Laboratório de Processamento de Sinais Universidade Federal do Rio de Janeiro Rio de Janeiro, Brasil seixas@lps.ufrj.br Lucas Alexandre Alvarenga Cardoso Departamento de Automática Universidade Federal de Lavras Lavras, Brasil lucas.cardoso@estudante.ufla.br Mayara Lisboa Soares de Bastos McGill University International TB Centre Rio de Janeiro, Brasil mayara_bastos@yahoo.com.br Danton Diego Ferreira Departamento de Automática Universidade Federal de Lavras Lavras, Brasil danton@ufla.br Anete Trajman Departamento de Clínica Médica Universidade Federal do Rio de Janeiro Rio de Janeiro, Brasil atrajman@gmail.com ResumoSistemas de apoio ao diagnóstico baseados em inteligência computacional (computer-aideddiagnosis, CAD) para interpretação de imagens vêm sendo desenvolvidos e aplicados em diferentes especialidades médicas. A Organização Mundial da Saúde recomendou recentemente o uso de CAD para a detecção de tuberculose em radiografias de tórax (RxT). No contexto do desenvolvimento de um CAD, muitas vezes é necessário fotografar imagens de RxT. No entanto, para melhores resultados é preciso que as imagens sigam um padrão, por isso desenvolveu-se um procedimento operacional padrão (POP) para fotografá-las. O objetivo deste estudo é o de criar um modelo baseado em máquinas de comitê (ensemble) para avaliar se fotografias de RxT aderem ao POP e classificar eventuais desvios do POP, para então corrigi-los e usar as imagens para a triagem de tuberculose ativa no CAD. Uma base de dados composta por 783 fotografias de radiografias de tóraxcom diferentes desvios do POP foi dividida em 10 grupos, de acordo com os desvios.Um grupo controle era composto de imagens sem desvios do POP.Os desvios referiam-se ao uso de aplicativos, tripé e temporizador, resolução, luz do ambiente, cobertura total do espaço não ocupado do negatoscópio e centralização. Um modelo ensemble, baseado em especialistas, aliado a transfer learning e análise de componentes principais (PCA) foi projetado para identificar cada um dos grupos. As acurácias médias para detecção dos desvios foram superiores a 79%. Palavras-chaveDiagnóstico assistido por computador, Tuberculose, Ensemble, Redes Neurais, Análise de Componentes Principais. I. INTRODUÇÃO Ferramentas computacionais que auxiliam na detecção e classificação de doenças têm sido desenvolvidas com o propósito de ajudar o profissional de saúde na tomada de decisão. Modelos preditivos de machinelearning(ML) podem auxiliar na tomada de decisão em inúmeros momentos da atenção à saúde, especialmente no diagnóstico, intervenção e acompanhamento de problemas de saúde [1]. Algoritmos de ML têm sido usados para, por exemplo, predizer risco de mortalidade em uma população idosa [2], para predição de incidência de casos de malária [3], diagnóstico baseado em imagem de COVID-19 [4], detecção de câncer de mama [5] e identificação de grau de risco de pé diabético [6], [7]. Sistemas computadorizados utilizando técnicas de deep learning [8] têm sido aprimorados. Entre eles, destacam-se as análises de imagens, em particular de radiografias e tomografias. Estudos de desenvolvimento de diagnóstico auxiliado por computador (CAD) baseados em deep learning têm sido apresentados em diversas áreas, como no auxílio ao diagnóstico de COVID-19 e outras pneumonias em imagens de radiografias de tórax (RxT) [8] e na classificação de linfomas malignos com base em imagens de exames histopatológicos [9]. A qualidade de um exame médico com imagem depende da qualidade da imagem e da habilidade do radiologista que a interpreta. A análise computadorizada de imagens tenta melhorar a interpretação do exame de imagens médicas, fornecendo uma segunda opinião ao radiologista, o que caracteriza o uso do CAD. A Organização Mundial da Saúde recomendou recentemente o uso de CAD em RxT para o rastreamento de tuberculose[10]. Em 2019, no mundo, cerca de 10 milhões de pessoas adoeceram e 1,4 milhões morreram vítimas da tuberculose [11]. Como agravante, os contatos de pacientes com a doença na sua forma mais comum, a pulmonar, correm o risco de contrair o Mycobacterium tuberculosis com elevado risco de adoecimento principalmente nos dois primeiros anos após a infecção [12]. Esta e outras populações expostas ou imunodeprimidas, como população privada de liberdade e pessoas vivendo com HIV, têm indicação de rastreio de tuberculose periodicamente. Entre elas, a maior é a de contatos com infecção recente: 56 milhões de pessoas. Para o rastreamento de contatos, o Ministério da Saúde do Brasil recomenda, para sintomáticos respiratórios, aqueles com prova tuberculínica positiva ou pessoas vivendo com HIV e imunodepressão acentuada, a exclusão da tuberculose ativa por meio da RxT [12] antes de iniciar o tratamento preventivo [12]. No entanto, a falta da RxT e a necessidade de especialistas para interpretar os resultados atrasam ou impedem o processo e, consequentemente, o início do tratamento preventivo[13], [14]. Nosso grupo se