爱奇艺电影信息爬虫(rediscrawlscrapy)
使用rediscrawlscrapy框架,爬取爱奇艺电影信息及演员信息(不包含电影video资源),可实现分布式(但没必要- -,数据不多)
数据保存至mysql,已做备份(aiqiyi.sql)
或者
redis(0) 中把 start_url 写入 aiqiyi:start_url (确保开启 redis 服务)
cmd: redis-cli
redis: select 0
redis: lpush aiqiyi:start_url 'http://list.iqiyi.com/www/1/-------------24-1-1-iqiyi--.html'
redis: exit
再运行 scrapy
cmd: scrapy crawl aiqiyi
或者
cmd: scrapy crawl aiqiyi