Caracterizando a Mortalidade Infantil utilizando técnicas de Machine Learning: um Estudo de Caso em dois Estados Brasileiros - Santa Catarina e Amapá / Characterizing Infant Mortality using Machine Learning techniques: a Case Study in two Brazilian States - Santa Catarina and Amapá

Wanderson L. G. Soares, Luis E. Zárate, Mark A. J. Song, Cristiane N. Nobre

Abstract


A mortalidade infantil é caracterizada pela morte de crianças menores de um ano e é um problema que afeta milhões de crianças em todo o mundo. O objetivo deste artigo é empregar conceitos de descoberta de conhecimento em bancos de dados, especificamente de aprendizado de máquina na fase de mineração de dados, para caracterizar a mortalidade infantil em dois estados do Brasil: Santa Catarina, com a menor taxa de mortalidade infantil dos estados do país, e Amapá, com a maior. Foram utilizados os classificadores C4.5, JRip, Random Forest, SVM e Multilayer Perceptron, sendo feita uma breve comparação dos resultados obtidos pelos classificadores em ambos os estados. Além disso, o pré-processamento do conjunto de dados é detalhado, o que inclui seleção de atributos e balanceamento de classes. Os resultados mostram que os recursos Apgar, Peso e Anomalia congênita se destacaram das regras geradas pelos classificadores baseados em árvore.


Keywords


Informática na saúde, Mortalidade infantil, Aprendizado de Máquina.

References


Christovam de Castro Barcellos; Walter Massa Ramalho. 2002. Situação atual do geoprocessamento e da análise de dados espaciais em saúde no Brasil. (2002).

Robert E Black, Simon Cousens, Hope L Johnson, Joy E Lawn, Igor Rudan, Diego G Bassani, Prabhat Jha, Harry Campbell, Christa Fischer Walker, Richard Cibulskis,Thomas Eisele, Li Liu; Colin Mathers. 2010. Global, regional, and nationalcauses of child mortality in 2008: a systematic analysis. The lancet375, 9730(2010), 1969–1987.

Ministério da Saúde Brasil. 2009. Manual de vigilância do óbito infantil e fetal e do Comitê de Prevenção do Óbito Infantil e Fetal.

Ministério da Saúde Brasil. 2018. Rede Interagencial de Informações para a Saúde. Indicadores e Dados Básicos para a Saúde.

Leo Breiman. 2001. Random forests. Machine learning45, 1 (2001), 5–32.

Leo Breiman. 1996. Bagging Predictors. In Machine Learning.123–140.

André Carvalho, K Faceli, AC LORENA; J GAMA. 2011. Inteligência Artificial–uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC(2011).

Chih-Chung Chang; Chih-Jen Lin. 2011.LIBSVM: A Library for Support Vector Machines. ACM Trans. Intell. Syst. Technol., 3 (May. 2011), 27:1–27:27. https://doi.org/10.1145/1961189.1961199

Alice Chen, Emily Oster, Heidi Williams. 2016. Why Is Infant Mortality Higher in the United States Than in Europe? American Economic Journal: Eco-nomic Policy8, 2 (May 2016), 89–124. https://doi.org/10.1257/pol.20140224

K. Faceli, J. Gama, A.C. Lorena, A.C.P.L.F. De Carvalho. 2011.Inteligência artificial: uma abordagem de aprendizado de máquina. Grupo Gen - LTC, São Paulo, Brasil.

Usama Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth. 1996. The KDD process for extracting useful knowledge from volumes of data. Commun. ACM39, 11 (1996), 27–34.

Rosângela Aparecida Pimenta Ferrari, Maria Rita Bertolozzi. 2012. Mortalidade pós-neonatal no território brasileiro: uma revisão da literatura. Revista da Escola de Enfermagem da USP46 (10 2012), 1207–1214. https://doi.org/10.1590/S0080-62342012000500024

Marcelo Zubaran Goldani, Marco Antonio Barbieri, Heloisa Bettiol, Marisa Ramos Barbieri, Andrew Tomkins. 2001.Infant mortality rates according to socioeconomic status in a Brazilian city. Revista de Saúde Pública35 (062001), 256 – 261.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-89102001000300007&nrm=iso

Alessandra Rivero Hernandez, Clécio Homrich da Silva, Marilyn Agranonik, Fernanda Maciel de Quadros, Marcelo Zubaran Goldani. 2011. Análise de tendências das taxas de mortalidade infantil e de seus fatores de risco na cidade de Porto Alegre, Rio Grande do Sul, Brasil, no período de 1996 a 2008.Cadernosde Saúde Pública27 (2011), 2188–2196.

Taghi M Khoshgoftaar, Moiz Golawala, Jason Van Hulse. 2007. An empirical study of learning from imbalanced data using random forest., 310–317.

Panagiota Kitsantas, Myles Hollander, Lei Li. 2006. Using classification trees to assess low birth weight outcomes. Artificial intelligence in medicine38, 3 (2006),275–289.

Ron Kohavi. 1995. A study of cross-validation and bootstrap for accuracy estimation and model selection. In IJCAI, Vol. 14. Montreal, Canada, 1137–1145.

John Lorenz, Cande Ananth, Richard Polin, M E D’Alton. 2016. Infant mortality in the United States. 36 (04 2016).

Ivana Teresinha Corrêa de Oliveira. 2001. Aplicação de Data Mining na busca de um modelo de prevenção da mortalidade infantil. (2001).

John Platt. 1998. Sequential minimal optimization: A fast algorithm for training support vector machines. (1998).

Ronaldo Cristiano Prati, GEAPA Batista, Maria Carolina Monard. 2003. Uma experiência no balanceamento artificial de conjuntos de dados para aprendizado com classes desbalanceadas utilizando análise ROC. In Proc. of the Workshop on Advances & Trends in AI for Problem Solving, Vol. 1. 28–33.

Francisco Quilici-Gonzalez, José Artur de Assis Zampirolli. 2015. Sistemas inteligentes e mineração de dados.

J. Ross Quinlan. 1993.C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.

Gregor Stiglic, Simon Kocbek, Igor Pernek, Peter Kokol. 2012. Comprehensive decision tree models in bioinformatics. PloS one, 3 (Mar. 2012), 33812. https://doi.org/10.1371/journal.pone.0033812

NO BRASIL UNICEF. 2008. Disponível em: http://www.unicef.org/brazil/pt/. Acesso em: junho de 2018(2008).

Rossana Cristina Xavier Ferreira Vianna, Claudia Maria Cabral de Barra Moro, Samuel Jorge Moysés, Deborah Carvalho, Julio Cesar Nievola. 2010. Mineração de dados e características da mortalidade infantil. Cadernos de Saúde Pública26 (2010), 535–542.




DOI: https://doi.org/10.34117/bjdv.v7i5.29380

Refbacks

  • There are currently no refbacks.