Skip to content

数据采集(行业、学科、行政区划、中图分类代码,30+W条科技报告数据)

Notifications You must be signed in to change notification settings

SAH01/data-collection

Repository files navigation

目录


1)data_cleaning文件夹

主要完成了对国民经济行业分类与代码(GB/4754-2017、2002、2011)三年的国标整理并存入MySQL数据库。 image


2)std_area文件夹

完成了对统计用区划和城乡划分代码的数据爬取和标准化整理(2009-2021)并存入MySQL数据库。

网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/

image image

3)std_subject文件夹

主要完成了中华人民共和国国家标准·学科分类与代码(2009、1992)的标准化整理并存入MySQL数据库。

image

4)report_data文件夹

完成对国家科技报告服务系统【https://www.nstrs.cn/index】30+W条科技报告数据的爬取和整理入库(mysql)

具体可以查看我的随笔:https://www.cnblogs.com/rainbow-1/p/16725576.html

About

数据采集(行业、学科、行政区划、中图分类代码,30+W条科技报告数据)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages