Seleção Objetiva de suporte e confiança mínimos em Mineração de Regras de Associação / Objective selection of minimum support and minimum confidence in Association Rule Mining

Authors

  • Dario Brito Calçada Brazilian Journals Publicações de Periódicos, São José dos Pinhais, Paraná
  • Roberta Akemi Sinoara
  • Solange Oliveira Rezende

DOI:

https://doi.org/10.34117/bjdv7n5-274

Keywords:

Medidas de Interesse, Redes, Reconhecimento de Padrões, Regras de Associação.

Abstract

A mineração de dados é frequentemente descrita como o processo de localização de padrões interessantes em grandes bancos de dados. Dada a grande quantidade de dados digitais que estão continuamente sendo gerados e armazenados, a mineração de dados oferece uma solução para o problema de resumir e pesquisar rapidamente relacionamentos não óbvios nos dados. Medidas de interesse são essenciais para a mineração de regras de associação. Como os algoritmos das Regras de Associação podem extrair as regras de acordo com suporte mínimo (minsup) e confiança mínima (minconf), a escolha dos valores destes parâmetros é crucial. Nesta pesquisa, é abordada a questão de definir o valor ideal de minsup e minconf no processo de Mineração de Regras de Associação. As principais contribuições deste trabalho são: (i) proposta de uma medida de Relevância, que possibilite a comparação objetiva de Redes de Regras de Associação; (ii) estudo da relação entre as medidas de centralidade e as medidas de regra de associação minsup e minconf; e (iii) propostas de métodos objetivos de seleção de minsup e minconf ideais, que permitiriam a avaliação de hipóteses relevantes no processo de mineração de dados. Os resultados indicam que se pode definir o minsup ideal com base nas características dos conjuntos de dados, e o minconf ideal com base em medidas de centralidade e redes de regras de associação.

References

Aggarwal, C. C. (2015). Data Mining: The Textbook. Springer International Publishing (1st ed.). New York, USA: Springer. https://doi.org/10.1007/978-3-319-14142-8

Agrawal, R., Imielinski, T., & Swami, A. (1994). Mining Association Rules between Sets of Items in Large Databases. Special Interest Group on Management of Data, 22(2), 22(2), 207–216. https://doi.org/10.1145/170036.170072

Agrawal, R., & Shafer, J. C. (1996). Parallel mining of association rules. IEEE Transactions on Knowledge and Data Engineering, 8(6), 962–969. https://doi.org/10.1109/69.553164

Agrawal, R., Srikant, R., & others. (1994). Fast algorithms for mining association rules. In Proc. 20th int. conf. very large data bases, VLDB (Vol. 1215, pp. 487–499).

Bonacich, P. (2001). Eigenvector-like measures of centrality for asymmetric relations. Social Networks, 23, 191–201.

Brandes, U. (2001). A faster algorithm for betweenness centrality. Journal of Mathematical Sociology, 25(2), 163–177. https://doi.org/10.1080/0022250X.2001.9990249

Brin, S., & Page, L. (1998). The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems, 30, 107–117.

Calçada, D. B., & Rezende, S. O. (2019). Filtered-ARN: Asymmetric objective measures applied to filter Association Rules Networks. CLEI Electronic Journal, 22(3), 1–16. https://doi.org/10.19153/cleiej.22.3.2

Calçada, D. B., & Rezende, S. O. (2018). Medidas Objetivas Assimétricas Aplicadas na construção de Redes de Regras de Associação. ICMC/USP. https://doi.org/10.1590/s0102-33061995000200018

Calçada, D. B., Rezende, S. O., & Teodoro, M. S. (2019). Analysis of green manure decomposition parameters in northeast Brazil using association rule networks. Computers and Electronics in Agriculture, 159(February), 34–41. https://doi.org/10.1016/j.compag.2019.02.013

Chawla, S. (2010). Feature Selection, Association Rules Network and Theory Building. JMLR: Workshop and Conference Proceedings - The Fourth Workshop on Feature Selection in Data Mining, 10, 14–21.

Coleman, T. F., & Moré, J. J. (1983). Estimation of Sparse Jacobian Matrices and Graph Coloring Blems. SIAM Journal on Numerical Analysis, 20(1), 187–209. https://doi.org/10.1137/0720013

de Campos, M. B. P., Maciel, G. da S., de Souza, S. S. F., Chavarette, F. R., & Lima, F. P. dos A. (2020). Artificial intelligence with continuous learning applied to pattern recognition. Brazilian Journal of Development, 6(5), 22778–22797. https://doi.org/10.34117/bjdv6n5/001

Domingues, M. A., & Rezende, S. O. (2005). Post-processing of Association Rules using Taxonomies. Proceedings of the 12th Portuguese Conference on Artificial Intelligence (EPIA 2005), 192–197. https://doi.org/10.1109/EPIA.2005.341293

Freeman, L. C. (1978). Centrality in social networks conceptual clarification. Social Networks, 1(3), 215–239. https://doi.org/10.1016/0378-8733(78)90021-7

Grahne, G., & Zhu, J. (2005). Fast algorithms for frequent itemset mining using FP-trees. IEEE Trans Knowl Data Eng, 17, 1347–1362. https://doi.org/10.1109/TKDE.2005.166

Liu, X., Zhai, K., & Pedrycz, W. (2012). An improved association rules mining method. Expert Systems with Applications, 39(1), 1362–1374. https://doi.org/10.1016/j.eswa.2011.08.018

Nettleton, D. F. (2013). Data mining of social networks represented as graphs. Computer Science Review, 7(1), 1–34. https://doi.org/10.1016/j.cosrev.2012.12.001

Newman, M. (2010). Networks: An introduction. The Journal of analytical psychology (1st ed., Vol. 55). New York, USA: Oxford University Press. https://doi.org/10.1111/j.1468-5922.2010.01872_2.x

Nguyen, L. T. T., & Nguyen, N. T. (2015). Updating mined class association rules for record insertion. Applied Intelligence, 42(4), 707–721. https://doi.org/10.1007/s10489-014-0614-1

Pandey, G., Chawla, S., Poon, S., Arunasalam, B., & Davis, J. G. (2009). Association Rules Network: Definition and Applications. Statistical Analysis and Data Mining, 1(4), 179–260. https://doi.org/10.1002/sam.10027

Sombra, T. R., Santini, R. M., Morais, E. C., Couto, W. O., Zissou, A. de J., Silva Campos, P. S., … Chase, O. A. (2020). Scientific social networks and artificial intelligence - a systematic review applied to recognition of standards. Brazilian Journal of Development, 6(3), 9941–9954. https://doi.org/10.34117/bjdv6n3-030

Wang, X., & Xu, Y. (2018). Mining Graph Pattern Association Rules. In Database and Expert Systems Applications (Vol. 11030, pp. 223–235). Springer International Publishing. https://doi.org/10.1007/978-3-319-98812-2

Yan, X., Zhang, C., & Zhang, S. (2005). ARMGA: Identifying interesting association rules with genetic algorithms. Applied Artificial Intelligence, 19(7), 677–689. https://doi.org/10.1080/08839510590967316

Yan, X., Zhang, C., & Zhang, S. (2009). Confidence metrics for association rule mining. Applied Artificial Intelligence, 23(8), 713–737. https://doi.org/10.1080/08839510903208062

Zaki, M. J., & Meira, M. J. (2013). Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. Cambridge University Press.

Zhang, R., Mao, Y., & Zhao, W. (2020). Knowledge graphs completion via probabilistic reasoning. Information Sciences, 521, 144–159. https://doi.org/10.1016/j.ins.2020.02.016

Published

2021-06-07

How to Cite

Calçada, D. B., Sinoara, R. A., & Rezende, S. O. (2021). Seleção Objetiva de suporte e confiança mínimos em Mineração de Regras de Associação / Objective selection of minimum support and minimum confidence in Association Rule Mining. Brazilian Journal of Development, 7(5), 47936–47960. https://doi.org/10.34117/bjdv7n5-274

Issue

Section

Original Papers