Dados públicos (Open Data) do GOV.BR - Agência Nacional de Petróleo, Gás Natural e Biocombustíveis.
Facilitar o download ou a atualização dos dados da ANP (Agência Nacional do Petróleo, Gás Natural e Biocombustíveis). Atualmente o projeto possui 2 soluções de downloads possíveis, carga e unificação dos dados consolidados das últimas 4 semanas e carga e unificação dos dados históricos de Combustíveis Automotivos.
- Faz uma captura no HTML da página do site que os dados são disponibilizados, obtem o url das bases que tem a atualização dos dados das últimas 4 semanas.
- Transforma o resultado da requisição em um dataframe
- Executa a unificação dos arquivos em um só e consolida como um .csv legível no diretório ./dados/
- Output: ./dados/dados_consolidados_combustivel.csv
- Executa uma série de funções responsáveis por identificar as URLs dentro do HTML da página, armazená-los e depois executar seus downloads.
- Extração dos arquivos zipados
- Definição do schema final para os dados
- Processamento dos arquivos em um só arquivo unificado
- Output: ./dados/historico_combustivel_auto.csv
A forma de utilização é simples, necessário ter python >3.9 instalado e as dependências abaixo. Após isso é só clonar o repositório localmente e executar os scripts conforme necessidade.
pip install requests
pip install polars