Consultas federadas sobre dados abertos conectados / Federated queries on connected open data

Gabriel Lucas Pimenta, Gisane Aparecida Michelon, Lúcelia de Souza, Josiane Michalak Hauagge Dall'Agnol, Sandro Rautenberg

Abstract


Dados disponibilizados podem ser conectados, modificados e compartilhados. Para melhorar a tomada de decisão, a otimização de processos e a descoberta de novas tendências, esses dados podem ser utilizados com a aplicação de novos métodos de processamento. O processamento de modo distribuído de consultas em várias bases é chamado de consultas federadas. Como ferramentas para o processamento, o gerenciamento e a pesquisa das consultas podem ser utilizadas a SPARQL ( Protocol and RDF Query Language ), o OpenLink Virtuoso e o Hadoop. A linguagem SPARQL utiliza arquivos em RDF ( Resource Description Framework ) para representar recursos na web para o processamento de consultas federadas.O OpenLink Virtuoso é um Sistema Gerenciador de Banco de Dados com várias características sendo conhecido como servidor universal. O Hadoop utiliza o MapReduce para processar um conjunto de dados e para fazer o armazenamento distribuído. Para a realização das pesquisas foram escolhidas como base de dados os índices de classificação de periódicos, tais como, o Qualis, da CAPES e a DBpedia, a qual extrai conteúdo estruturado contidos na Wikipedia. Na DBpedia a ideia é buscar periódicos que possuem o Fator de Impacto (FI) baseado em outros índices como o JCR ( Journal Citation Reports ) para comparação com o índice Qualis. Essas duas bases, o Qualis e a DBpedia podem ser integradas mediante o ISSN ( Número de Série do PadrãoInternacional ) com o objetivo de gerar novas informações que auxiliam na tomada de decisões. Neste trabalho foi relacionado os índices registrados em ambas as bases de dados, integrando-se como através do ISSN, comparando a classificação de periódicos Qualis com o Fator de Impacto da DBpedia. Isso resultou na possibilidade de uso de mais um índice de classificação de periódicos para pontuação das publicações dos pesquisadores, pois nem sempre um periódico está classificado em todos os índices.

 


Keywords


Dados abertos conectados, processamento distribuído e SPARQL

References


Apache MapReduce. A Programming paradigm that allows for massive scalability of unstructured data across hundreds or thousands of commodity clusters servers in an Apache Hadoop cluster. Disponível em: https://www.ibm.com/analytics/hadoop/mapreduce. Acessado em julho de 2020.

Berners-Lee, T. Linked data-design issues, 2009. Disponível em http://www.w3.org/DesignIssues/LinkedData.html. Acessado em julho de 2020.

Buil-Aranda, C., Arenas, M., and Corcho, O. Semantics and optimization of the sparql 1.1 federation extension. Proceedings of the 8th extended semantic web conference on The semantic web: research and applications - Vol II. Springer-Verlag, pp. 1–15, 2011.

Dbpedia. Disponível em http://wiki.dbpedia.org/. Acesso em janeiro de 2018.

Lima, J. C. e Carvalho, C. L. Resource Description Framework (RDF), 2005. Disponível em: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_003-05.pdf. Acesso em julho de 2020.

DuCharme, B. Learning Sparql. "O’Reilly Media, Inc", 2013.

Hurwitz, Judith; Nugent, Alan; Halper, Fern; Kaufman, Marcia. Big Data For Dummies. 1St edition. For Dummies, 2013.

Lima, J. C. e Carvalho, C. L. Resource Description Framework (RDF), 2005. Disponível em: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_003-05.pdf. Acessado em julho de 2020.

Macedo Sousa Maia, João Carlos Pinheiro, Regis Pires Magalhães, José Maria da Silva Monteiro Filho, Vânia Maria Ponte Vidal. Junções Adaptativas em Consultas Federadas sobre Linked Data Simpósio Brasileiro de Bancos de Dados - SBBD 2012, Short Papers, 2012.

Open Knowledge. Open Definition 2.1. Disponível em: http://opendefinition.org/od/2.1/en/ Acessado em 22 de dezembro de 2017.

OpenLink Software. OpenLink Virtuoso Home Page. Disponível em: https://virtuoso.openlinksw.com. Acesso em julho de 2020.

Rautenberg, S. et al. Guia prático para publicação de dados abertos conectados na web. Editora Appris, 2018.

Schwarte, K.A., J.R. Russell, J.L. Kovar, D.G. Morrical, S.M. Ensley, K.-J. Yoon, N.A. Cornick, and Y.-I. Yoon. Grazing management effects on sediment, phosphorus, and pathogen loading of streams in cool-season grass pastures. Journal of Environment Quality 40:1303-1313, 2011.

Qualis. Qualis Periódicos. Disponível em https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/veiculoPublicacaoQualis/listaConsultaGeralPeriodicos.jsf. Acesso em setembro de 2020.

Wikipedia. Disponível em https://pt.wikipedia.org/wiki/Qualis. Acesso em julho de 2020.

World Wide Web Consortion. W3c - SPARQL Query Language for RDF. Disponível em: https://www.w3.org/TR/rdf-sparql-query/#basicpatterns. Acesso em fevereiro de 2018.

World Wide Web Consortion. W3c - SPARQL 1.1 Overview. Disponível em: https://www.w3.org/TR/2013/REC-sparql11-overview-20130321. Acesso em março de 2018.




DOI: https://doi.org/10.34117/bjdv7n1-451

Refbacks

  • There are currently no refbacks.