Desenvolvimento de uma nova técnica de extração de conjuntos de similaridade para relações não simétricas / Development of a novel similarity set extraction technique addressing non-symmetrical relations

Authors

  • André Eduardo Alessi
  • Bruno Duarte
  • Ives Renê Venturini Pola
  • Marco Antonio de Castro Barbosa

DOI:

https://doi.org/10.34117/bjdv7n8-031

Keywords:

Conjuntos de Similaridade, Dados Complexos, Grafos, Banco de Dados.

Abstract

O principal fundamento matemático dos sistemas gerenciadores de bancos de dados é a teoria dos conjuntos. Em um conjunto, não existem pares de elementos iguais. Porém, a comparação exata entre dados complexos não traz informações relevantes, sendo preferível a utilização de comparações por similaridade. Para representar a ideia de um conjunto onde não há pares de elementos suficientemente similares, surgiu o conceito de conjuntos de similaridade. Neste trabalho, a base teórica desse conceito foi estendida para tratar relações não simétricas de similaridade. Como contribuição, uma nova técnica de extração de conjuntos de similaridade foi desenvolvida, a Asymmetric_Distinct. A nova técnica foi avaliada em experimentos, mostrando-se estável e escalável e permitindo novas frentes de pesquisas na área.

 

References

BARABÁSI, A. L.; ALBERT, R. Emergence of scaling in random networks. Science, v. 286, p. 509 - 512, 1999.

BARIONI, M. et al. Querying complex objects by similarity in SQL. In: Simpósio Brasileiro de Bancos de Dados, 20., 2005, Uberlândia. Anais... Uberlândia: UFU, 2005. p. 130 - 144.

BARIONI, M. et al. Seamlessly integrating similarity queries in SQL. Software: Practice and Experience, [S.l.], v. 39, n.4, p. 355 - 384, mar. 2009.

BENEDETTI, F. et al. Computing inter-document similarity with context semantic analysis. Information Systems, v. 80, p. 136 - 147, 2019. ISSN 0306-4379.

COSTA, L. et al. Characterization of complex networks: A survey of measurements. Advances in Physics, v. 56, n. 1, p. 167 - 242.

ERD?S, P.; RÉNYI, A. On random graphs. Publ. Math, v. 6, p. 290 - 297, 1959.

GIRVAN, M.; NEWMAN, M. E. J. Community structure in social and biological networks. Proceedings of the National Academy of Science of the United States of America, v. 99, p. 7821 - 7826, 2002.

GODDARD, W.; HENNING, M. A. Independent domination in graphs: A survey and recent results. Discrete Mathematics, v. 313, n. 7, p. 839 - 854, 2013.

HAGBERG, A. A.; SCHULT, D. A.; SWART, P. J. Exploring network structure, dynamics, and function using NetworkX. In: Python in Science Conference, 7., 2008, Pasadena, CA USA. Proceedings… Pasadena: [s.n.], 2008, p. 11 - 15.

KIM, T. et al. Similarity query support in big data management systems. Information Systems, v. 88, p. 1 - 23.

LEVENSHTEIN, V. I. Binary codes capable of correcting spurious insertions and deletions of ones. Problems of Information Transmission, Kluwer Academic Publishers, v. 1, p. 8-17, 1965.

LIATSIS, P. et al. Proposal and study of statistical features for string similarity computation and classification. International Journal of Data Mining, Modelling and Management, v. 12, p. 277 - 307, 2020.

PIMENTA, G. L. et al. Consultas federadas sobre dados abertos conectados. Brazilian Journal of Development, v. 7, n. 1, p. 6659 - 6673, 2021.

POLA, I. R. V. et al. Similarity sets: A new concept of sets to seamlessly handle similarity in database management systems. Information Systems, v. 52, p. 130 - 148, 2015. ISSN 0306-4379.

WATTS, D.; STROGATZ, S. Collective dynamics of ‘small-world’ networks. Nature, v. 393, p. 440 - 442, 1998.

ZEZULA, P. et al. Similarity Search - The Metric Space Approach. New York: Springer, 2006.

ZIGHED, D. A. et al. Mining Complex Data. Heidelberg: Springer, 2009.

Published

2021-08-03

How to Cite

Alessi, A. E., Duarte, B., Pola, I. R. V., & Barbosa, M. A. de C. (2021). Desenvolvimento de uma nova técnica de extração de conjuntos de similaridade para relações não simétricas / Development of a novel similarity set extraction technique addressing non-symmetrical relations. Brazilian Journal of Development, 7(8), 76163–76180. https://doi.org/10.34117/bjdv7n8-031

Issue

Section

Original Papers