天眼查、企查查公司信息爬虫

使用说明

设置用户状态

抓包工具抓包天眼查、企查查小程序，设置请求头用户鉴权信息，在各自目录的init.py文件中。可在此处配置随机UA，项目地址：fake_useragent

设置数据源

MYSQL_CONFIG = {
    'develop': {
        'host': '192.168.1.103',
        'port': 3306,
        'db': 'enterprise',
        'username': 'root',
        'password': 'root@123'
    }
}

执行db/data.sql生成数据结构
配置IP代理config/settings, 开启global proxy前请先自行部署ip代理池，项目地址：proxy_pool
```
# 全局代理控制, 
GLOBAL_PROXY = True
PROXY_POOL_URL = "http://localhost:5010"
```

设置爬取关键字qichacha&tianyancha

keys = ['Google'] # 设置爬取列表
crawler.load_keys(keys)
crawler.start()

Schedule List

功能	日期	状态	备注
鉴权Token提取		待完成
内置IP代理		待完成
防封策略		待完成
容器化运行		待完成

Please Kindly Note That

程序员技术交流tg群，欢迎大家加入！！！

内有技术交流！工作内推！远程工作！兼职、私活儿！！。

Telegram群链接：程序员社区https://t.me/+iZK2y8zMUiE0NDE1

群二维码：

Name		Name	Last commit message	Last commit date
Latest commit History 59 Commits
config		config
db		db
qichacha		qichacha
tianyancha		tianyancha
util		util
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
qichacha.py		qichacha.py
requirements.txt		requirements.txt
tianyancha.py		tianyancha.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

天眼查、企查查公司信息爬虫

使用说明

Schedule List

Please Kindly Note That

About

Releases

Packages

Languages

License

bouxin/company-crawler

Folders and files

Latest commit

History

Repository files navigation

天眼查、企查查公司信息爬虫

使用说明

Schedule List

Please Kindly Note That

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages