house_info 这个是房产信息的爬虫,暂时上传了自如网杭州租房信息、安居客杭州租房信息: 自如网爬虫需要用到:tesser-ocr和pytesseract包,进行图片识别用的, 安居客需要破解自定义的数字字体,不需要额外包。 以上数据都可以打包成csv文件或者存储到数据库MongoDB中。