Na matemática, a teoria dos grafos permite encontrar as relações entre os objetos de um determinado conjunto. Nesse caso, as conexões entre vértices e arestas que os grafos mostram podem ser utilizadas para investigar grandes bancos de dados de forma visual e interativa. Assim, é possível estabelecer o elo entre empresas, políticos, pagamentos, obras públicas, entre outros dados. Essa teia pode ser explorada e visualizada com o auxílio de grafos. E é isso que a Abraji – Associação Brasileira de Jornalismo Investigativo traz com o Manual do CruzaGrafos.
O CruzaGrafos é uma ferramenta gráfica, de software livre, que permite verificações cruzadas e investigações avançadas de dados públicos. O projeto existe desde 2020 e é fruto da parceria entre a Abraji e o Brasil.IO.
Grafos ganharam muita visibilidade com o Panamá Papers, trabalho de 2016 do Consórcio Internacional de Jornalistas Investigativos. Entre as tecnologias utilizadas estavam os sistemas de gerenciamento de banco de dados em grafos Neo4J e Linkurious para busca e visualização dos dados.
A equipe do projeto CruzaGrafos faz análise exploratória de dados em bases de dados de interesse público no Brasil. O trabalho foi feito por meio de pesquisas sobre portais de acesso a dados abertos no Brasil, conversas com especialistas.
No momento, por exemplo, o CruzaGrafos já tem 29,4 milhões de registros, sendo que são 20 milhões de pessoas e 9 milhões de empresas. E nos grafos podemos ver as relações de proximidade e sociedade de todas essas informações. Os programadores do projeto usaram linguagens de programação como Python, CSS, JavaScript, HTML, Shell e PLpgSQL para traduzir isso em cruzamentos e visualizações interativas de grandes bases de dados da Receita Federal e do Tribunal Superior Eleitoral.
Atualmente o CruzaGrafos tem dados de candidaturas eleitorais coletados no Tribunal Superior Eleitoral, com as informações gerais como ano da eleição, cargo, nome completo, nome urna, número sequencial no pleito, partido político, unidade eleitoral, unidade federativa e CPF completo do candidato.
E ainda dados da Receita Federal do Brasil sobre empresas com QSA (Quadro de Sócios e Administradores), com informações como nome fantasia, razão social, nomes completos dos sócios, CNPJ e o CPF “mascarado” dos sócios – a Receita e outras instituições públicas não publicam o conteúdo inteiro do CPF, de 11 dígitos, mas coloca asteriscos em alguns números, como nesse exemplo: ***.270.068-**
As conexões e grafos da plataforma são então produzidos com o cruzamento das principais chaves de identificação – no caso aqui CPF, CNPJ e nome completo.
Essas bases dados são periodicamente atualizadas pelos órgãos públicos e também serão da mesma forma atualizadas no CruzaGrafos. O projeto também irá incluir outras bases de dados de interesse público e jornalístico ao longo dos meses.
Confira o que é possível fazer:
- Procurar todas as empresas ligadas a um político/candidato a cargo público nas quais ele ou ela seja sócio(a) ou administrador(a);
- Nessas empresas ver quais são os outros sócios(as);
- Verificar também a rede proximidade desses sócios(as), isto é, de quais outras empresas eles são sócios(as) e os outros respectivos sócios(as), em diferentes graus de proximidade;
- Descobrir se o caminho que separa uma pessoa/empresa de outra pessoa/empresa é curto ou se existe realmente;
- Tendo de antemão a lista de parentes ou assessores de políticos ou de pessoas de interesse público, saber se eles têm empresas (tática que poderia ser usada para encobrir patrimônio, por exemplo);
- Verificar se político(a) ou candidato(a) nas eleições têm empresas de ramos econômicos possivelmente conflitantes com seu cargo público;
- Saber se um político(a)/candidato(a) ou pessoa de interesse público têm várias empresas em seu nome do mesmo ramo e/ou com nomes semelhantes (tática que poderia ser usada para lavagem, por exemplo).
Para mais detalhes, conheça o manual do CruzaGrafos e estes dois arquivos: tutorial1 e tutorial2.