yapCrawler yet another python crawler Progress Text Extractor 正文提取,参考 基于行块分布函数的通用网页正文抽取算法 实现 Python 版本做粗略文本提取。 Example: python extractor.py http://hb.qq.com/a/20130324/000235.htm Live Demo: https://py-newt0n.rhcloud.com/