pip install "scrapy>=2.5.1" # 推荐使用2.5.1+版本
-
对于Windows环境用户:
直接通过pip安装的scrapy库可能出现
[winRrror 126] 找不到指定模块的问题
。原因是安装twist模块出现问题,建议从这里下载twist安装包完成安装(注意版本匹配) -
安装其他库
pip install -r requirement.txt """ itemadapter==0.3.0 PyYAML==6.0 requests==2.27.1 Scrapy==2.6.1 selenium==4.4.3 """
CrawlManaga提供了一系列测试网站及其测试的url,点击这里查看信息
cd maoflyManga
conda activate env
python start_maofly_spider.py
如果不使用提供的测试url,可以修改config_url.yaml文件,添加对应的漫画名及其开始的url 例如:
ONE PIECE航海王: https://www.maofly.com/manga/5668/612445.html
一拳超人: https://www.maofly.com/manga/7054/612375.html
咒术回战: https://www.maofly.com/manga/32670/612664.html
国王排名: https://www.maofly.com/manga/41341/610373.html
间谍过家家: https://www.maofly.com/manga/10127/610509.html
漫画名:url
cd xingqiuManga
conda activate env
python start_xingqiu_spider.py
如果不使用提供的测试url,可以修改config_url.yaml文件,添加对应的漫画名及其开始的url(同上)
-
安装相关库
pip install -r requirement.txt """ paramiko==2.8.1 PyYAML==6.0 requests==2.27.1 selenium==4.4.3 tqdm==4.64.0 """
uploadServer提供了一系列测试文件夹,点击这里查看信息
cd uploadServer
conda activate env
python upload_server.py
如果不使用提供的测试文件夹,注释掉测试文件夹部分代码如下:
# 测试文件夹
"""
upload_list = [r"D:\programmeProject\pycharmProject\CrawlManga\maoflymanhua\maoflymanhua",
r"D:\programmeProject\pycharmProject\CrawlManga\xingqiumanhua\xingqiumanhua"]
for i in upload_list:
produce_index(i) # 测试文件
upload(os.path.join(i, "images"))
"""
# 自定义文件夹
upload("dirname")