Painel Unificado: convergindo bases de dados da Administração Pública Federal

O Sociedados contém um conjunto de repositórios de dados abertos, scripts, uma rede de pesquisadores e entusiastas em ciência de dados e um conjunto de desafios (Kaggle) para extrair informações úteis para auxiliar gestores e tomadores de decisão.

Entre os maiores desafios ao utilizar as bases de dados abertas do governo fica evidente a falta de integração destas bases. Além disso, não é comum que os dados estejam disponíveis na mesma frequência, sendo que alguns são mensais, outros anuais, e até períodos maiores a depender do tipo de dados.

Um dos projetos associados ao Sociedados estudou a difusão de práticas de gestão de riscos, segurança da informação e integridade e ética na Administração Pública Federal (APF). Em um primeiro momento, foram levantadas as informações sobre a adoção de inovações gerenciais em órgãos da APF através da LAI. Para maiores informações da metodologia e resultados clique aqui.

Após isso, foi proposto um levantamento do perfil destas organizações para elucidar questões como: o salário médio dos servidores afeta a adoção das inovações gerenciais? Positivamente ou negativamente? Qual impacto da idade e do tamanho das organizações?

Entretanto, as variáveis necessárias para responder estas e outras tantas perguntas, se encontram em bases governamentais diferentes, que não possuem integração. Visando solucionar e integrar as bases governamentais, surge o Painel Unificado, uma iniciativa para que pesquisadores possam ter diversas variáveis como: escolaridade, remuneração de servidores, idade, sexo, tamanho dos órgãos da APF, reunidas em um só lugar.

O Painel Unificado é uma iniciativa única que permitiu a integração de 4 bases de dados: SIAPE, SIORG, SIOP e PEP. Somam-se a elas o levantamento das práticas gerenciais através da LAI e o levantamento de governança do TCU.


As bases de dados


Em 2011 foi promulgada a Lei de Acesso à Informação (LAI), fornecendo ao governo parâmetros muito claros na prestação de informações solicitadas pela população. A LAI impõe como dever dos órgãos e entidades públicas a divulgação de informações em locais de fácil acesso, independentemente de ser ou não solicitada pela população. Para tornar isso possível, diversos Sistemas do Governo Federal, antes exclusivos, disponibilizaram seus dados publicamente, tais como:

  • O Sistema Integrado de Administração de Pessoal (SIAPE), através do Portal da Transparência, disponibilizou, entre outras coisas, os dados de pessoal e de remuneração dos servidores civis e militares da Administração Pública Federal;
  • O Sistema de Informações Organizacionais (SIORG), que disponibiliza a estrutura organizacional da APF e permite “Recuperar em tempo real o histórico das estruturas organizacionais do Estado”; e
  • O Sistema Integrado de Planejamento e Orçamento (SIOP) começou a ser desenvolvido em 2009 e registra informações sobre planejamento e orçamento público, tendo hoje mais de 3000 usuários.

Além disso, outras iniciativas surgiram, visando simplificar o acesso e a leitura dos dados e cruzando bases distintas. Alguns exemplos destas iniciativas são o Painel Estatístico de Pessoal - PEP; o INFOGOV e o Atlas do Estado Brasileiro. Apesar de algumas iniciativas, o cruzamento de bases tão distintas é um processo não tão intuitivo. Algumas das razões para isso se devem ao fato de que:

  • Não existe um identificador único comum entre todas as bases de dados.
  • As bases possuem quantidades de órgãos distintas entre si.
  • Os períodos de disponibilidade dos dados são distintos.
  • Não temos dados para o todo o período analisado.
  • Os órgãos mudam de nome, se fundem ou são extintos no decorrer do tempo.


Integração das bases


Cada cidadão brasileiro possui um Cadastro de Pessoa Física (CPF), que além de ser único é instranferível e inalienável. O mesmo vale para as empresas que possuem um CNPJ.

No universo da Administração Pública, o cenário é outro. Cada base de dados possue uma forma de identificar os orgãos pertencentes a ela. Essa forma, normalmente um código, é distinto em cada orgão. Por exemplo, a Advogacia Geral da União é identificada pelo código "63000" no SIOP, "46" no SIORG e "40106" no SIAPE.

Na falta de um identificador único, buscou-se por meio do nome do órgão e sigla realizar a unificação. Esta forma de cruzamento, oferece novos desafios, já que o mesmo orgão pode possuir nomes ligeiramente diferentes entre as bases. Por exemplo, o CEITEC, consta no SIORG como "Centro Nacional de tecnologia avançada S. A", já no SIAPE como "Centro Nacional de tecnologia avan".

Portanto, decidiu-se por um tratamento nos nomes dos orgãos, buscando uma padronização. Mesmo após a padronização, alguns orgãos, que possuiam nomes muito distintos entre as bases, não foram relacionados. Seguiu-se então ao relacionamento manual dos restantes.

Ainda, estes órgãos podem ser fundidos, desmembrados e até extintos, fazendo com que estudos e análises sejam prejudicados por conta destes acontecimentos.

Caso queira saber mais sobre cada fonte de dados que foi integrada ao Painel unificado, foi escrito artigos independentes para cada uma. Neste artigos são explicadas as escolhas de cada base, as variáveis que foram utilizadas, o metódo de criação de novas variáveis, além do local onde poderá encontrar as bases originais.

Confira o dicionário de dados aqui.



Visualizando o Painel Unificado


Como citar?

Gustavo ALVES, Carlos Denner dos SANTOS; 2020. Painel Unificado da Adoção de Práticas Gerenciais pelo Órgãos Públicos Federais Brasileiros: uma base de dados integrativa do SIAPE, SIORG, SIOP, e o levantamento de governança do TCU. Disponível em https://grc-unb.github.io/post.html