A SEMANTIC PROPOSAL TO FEDERATE SPARQL QUERIES ON EKGS

Autores

  • Tulio Vidal Rolim
  • Vania Maria Ponte Vidal

Resumo

Um Grafo de Conhecimento Corporativo (EKG) é compreendido como uma tripla {OD,V,L}: onde OD = Ontologia de Domínio; V = Conjunto de Visões Locais {Ovi, Mvi}, onde Ovi é um conjunto de Ontologias Locais de cada fonte de dados S e Mvi é um mapeamento entre Ov e S. L = Conjunto de Visões de Ligações entre V’s. A proposta pode ser realizada através de duas abordagens distintas: i) Federada sob Endpoints e ii) Federada sob Repositórios, neste trabalho focou-se na proposta Federada sob Endpoints. Como forma de validar a proposta foi realizado um estudo de caso envolvendo dados da REDESimples (REDESIM) e da Receita Federal do Brasil (RFB) com ênfase em encontrar uma resposta para a seguinte pergunta: “Existem empresas na RFB com sócios distintos na REDESIM?”. Para responder a questão são realizados os seguintes passos: i) uma consulta SPARQL Q é processada através do Semagrow um Federador SPARQL F’ responsável por fazer a seleção das fontes S1...Sn aptas a responderem um triple pattern t, onde cada fonte é um Endpoint SPARQL E1...En, sendo a RFB compreendida como S1 acessível em E1 e a REDESIM como S2 sendo acessível E2; ii) A consulta Q é dividida em sub-consultas QK...QKn e executadas em E1 e E2; iii) Para S1 o armazenamento é relacional necessitando-se da utilização do Ontop para realização da virtualização através de um wrapper que obtém uma sub-consulta QK e faz a reescrita em uma consulta SQL QQ sob S1. Para S2 no formato RDF os dados são armazenados no Triplestore (GraphDB) e acessados diretamente através de E2; iv) Após processar cada sub-consulta QK..QKn o resultado é retornado ao Semagrow que faz a junção dos resultados e retorna diretamente ao usuário. O presente trabalho expôs um relato de proposta para realização de consultas em EKGs híbridos utilizando a abordagem sob Endpoints SPARQL. Como trabalhos futuros pretende-se apoiar a proposta através de uma ferramenta para configuração e integração semi-automática entre os componentes da proposta.

Downloads

Não há dados estatísticos.

Publicado

2021-01-01

Edição

Seção

XIII Encontro de Pesquisa e Pós-Graduação