Skip to content

Marcovaldong/PyCrawler

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PyCrawler

这是一个由Python实现的、基于MySQL的电商网站爬虫项目,整个项目是我和杰哥瑶哥三个人在2016年11月到12月利用业余时间完成的,主要是爬取了阿里的1688等7个网站的部分商品信息和图片。

对于我而言学到的新东西是如何将爬到的数据放到MySQL中,如何分析URL来获取到网站上的整个商品列表,如何爬取动态加载的网站(用了Phantomjs和Selenium)。关于如何爬取动态加载的网站请看我的博客

About

A flexible spider based on mysql

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 96.2%
  • JavaScript 3.8%