Skip to content

一个可以同时记录多个用户的哔哩哔哩粉丝数变化为特定格式的txt文档的python爬虫。

Notifications You must be signed in to change notification settings

YujioNako/bilibili_fans_record

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

bilibili_fans_record

一个可以同时记录多个用户粉丝数变化为特定格式的txt文档的python程序。

具体用法

安装好依赖库并更改好uid等相应参数后直接运行即可。

相关参数

基础
jump:每轮爬取的间隔,单位为秒。不建议太低以免被ban。请注意每个用户抓取时间间隔,实际jump = 目标jump - 抓取的用户数量 * 每个uid抓取间隔(即下面提到的wait) + 1。
uids:目标用户的id号,格式参照示例即可。
进阶
wait:一轮爬取中,每个目标数据的爬取间隔。若目标较少,且jump较大,则可以wait值可以较小。若目标较多或jump较小时,则wait不宜过小,以防止IP被ban。
可以将“文档”二字更改为你想要的文件夹名,该文件夹位于与主程序同级的目录上。
本版本默认以wikitext的格式进行保存,在wikitext模式下将直接显示为表格。您可以通过修改file_handle.write后及str2 = 后内容改变记录格式,但我们十分不建议您这样做,因为这可能导致记录排版混乱。
定时器版本操作说明
本版本可在每日特定时间开始新一轮记录,而取消使用倒计时。
本版本中,jump为无效参数,可不予以理会。
更改time_interval的参数即可实现记录时间的更改。注意:更改的参数时,应该严格保证time_interval的区间为1分钟。(即time_interval = Interval("HH:MM:SS", "HH:MM+1:SS"))
您可以增删time_interval以增删记录时间点;增删time_interval时您应当同步增删相应的诸如 now_time in time_interval 的字段。
json版本的操作说明
json版参数基本上与定时器版本一致,只是改用了json格式储存,机器可读性更好
json版本推荐使用.config储存要观测的uid,其中用形如[2,114514,1919810,...]的格式储存即可
具体实例可参考 我们制作的粉丝观测小站: http://www.pro-ivan.com/bilibili/

其他内容不建议更改。

About

一个可以同时记录多个用户的哔哩哔哩粉丝数变化为特定格式的txt文档的python爬虫。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages