Skip to content

A beginner data engineering project which involves scrapping offers from https://www.mercadolivre.com.br/ofertas, stores in a postgres database and analyze the data scrapped.

Notifications You must be signed in to change notification settings

lucasboscatti/mercado-livre-crawler

Repository files navigation

mercado-livre-crawler

Este é um projeto de nível iniciante para a área de engenharia de dados. O objetivo é extrair dados das ofertas de produtos do site Mercado Livre e armazená-los em um banco de dados PostgreSQL com um mesmo schema. Na branch docker-version está implementado o código para ser executado localmente em um container Docker com orquestramento do crawler e do banco de dados feito pelo Docker Compose. Na branch principal está o código para ser executado e hospedado na plataforma Heroku. O banco de dados também está hospedado nesta plataforma com um limite de 10.000 registros.

Artigo

Escrevi um tutorial no Medium com um passo a passo para realizar o deploy de um Crawler com Scrapy no Heroku.

Análise dos dados

Neste repositório fiz uma limpeza e análise dos dados coletados por este crawler.

About

A beginner data engineering project which involves scrapping offers from https://www.mercadolivre.com.br/ofertas, stores in a postgres database and analyze the data scrapped.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages