Este projeto realiza o scraping (coleta de dados) de produtos da categoria Hardware do site Kabum utilizando a API pública da empresa. As informações são extraídas em formato JSON e exportadas para um arquivo Excel.
-
Coleta de dados de produtos de hardware: Através de requisições para a API da Kabum, são coletadas informações como:
- Nome do produto
- Preço
- Preço com desconto
- Quantidade disponível
- Avaliação de usuários
- Garantia
- Fotos
-
Exportação para Excel: Os dados coletados são salvos em um arquivo Excel, com a possibilidade de adicionar mais categorias de produtos no futuro.
- Python
- Requests
- Openpyxl
- ThreadPoolExecutor
Clone este repositório e instale as dependências:
git clone https://github.com/pedrohcleal/kabum-api-scraper.git
cd kabum-api-scraper
pip install -r requirements.txt
- Execute o arquivo
main.py
para iniciar a coleta de dados e gerar o arquivo Excel:
python main.py
- O arquivo
hardware_products.xlsx
será gerado com os produtos extraídos da API.
kabum-api-scraper/
├── main.py # Script principal de coleta e exportação
├── requirements.txt # Dependências do projeto
└── readme.md # Documentação do projeto
Sinta-se à vontade para contribuir com o projeto, criando novos recursos ou corrigindo problemas.
- Faça um fork deste repositório.
- Crie uma branch para a sua modificação (
git checkout -b feature/nova-modificacao
). - Faça commit das suas alterações (
git commit -am 'Adicionando nova funcionalidade'
). - Envie para o repositório remoto (
git push origin feature/nova-modificacao
). - Abra um pull request.