Amazon Web Scraping

Sumario

Resumo
Requisitos
Instruções de instalação
Descrição dos arquivos
Resultado

Resumo do projeto

Este projeto tem como objetivo realizar a extração de alguns dados do site amazon.com utilizando a biblioteca BeautifulSoup e enviá-los para o google sheets. Dados extraidos:

Link do produto
Nome do produto
Valor
Avaliação (nota)
Disponibilidade (Em estoque)

Requisitos

O código deve ser executado sem problemas usando Python versões 3 com as seguintes bibliotecas:

Web Scrapping: BeautifulSoup
Google Integrations: Oauth2client, gspread

Instruções de instalação

Crie um projeto na sua conta do Google Drive.
- Habilite as APIs do Google Drive e Google Sheets.
- Crie as credenciais de acesso e gere o arquivo JSON, salve como "credenciais.json"
- Tutorial: https://pt.linkedin.com/pulse/manipulando-planilhas-do-google-usando-python-renan-pessoa
Faça login na sua conta amazon e na página inicial acesse o inspetor do navegador (F12)
- Procure por Rede, no primeiro link que aparecer clique com o botão direito do mouse e vá em Copiar valor > Copiar como cURL
- Acesse o site: https://curlconverter.com/ copie o cCurl e converta em JSON.
- Acesse o site: https://jsoneditoronline.org/#left=local.pelema e salve como "url_parameters.json"
Abra o arquivo "links.csv" e informe todas as URLs que você deseja buscar, cada URL em uma linha (mantenha o cabecalho)
Abra o arquivo "web_scraping.py" e na linha 83 informe o ID do seu Google Sheets.

Descrição dos arquivos

Dados
- links.csv - tabela com a lista de links que voce deseja buscar
- requirements.txt - lista das bibliotecas necessarias para rodar o codigo
- web_scraping.py - Código em python para fazer o web scraping

ATENÇÃO: Não se esqueça de criar os arquivos JSON descritos na etapa Instruções de instalação

Resultados

Toda vez que você rodar o código, serão adicionadas novas linhas com a data/hora que foi realizado a consulta.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Amazon Web Scraping

Sumario

Resumo do projeto

Requisitos

Instruções de instalação

Descrição dos arquivos

Resultados

Files

README.md

Latest commit

History

README.md

File metadata and controls

Amazon Web Scraping

Sumario

Resumo do projeto

Requisitos

Instruções de instalação

Descrição dos arquivos

Resultados