- 在新版 PubMed 搜索结果点击 Save 按钮
- Selection 选 All results,Format 选 PMID
- 点击 Create file 下载到 pmid-xxx-set.txt 文件
- 重命名你下载到的文件为 pmid-set.txt,覆盖我的示例 pmid-set.txt 文件,
- 在控制台运行下列命令,产生的 output.xml 文件应该就是我们需要的XML文件了。
python main.py
其中用到的两个Python包:requests 和 lxml 是需要事先安装好的。
如何使用pip安装我就不赘述了,百度一下自然就有。
- 华天清大神在其博文《Python使用xslt提取网页数据》中提供的在 Python 中使用 xslt 的指导