作者编写了几个机器学习、自然语言处理领域的小工具。
每个小工具均由一个单一的.py
(python3)文件构成,具备最基本功能,可以独立使用。
目的:
- 用于理解相关算法原理
- 直接运用于简单场合
- 以此开发更好的工具
源代码: https://github.com/zhangkaixu/minitools
git: https://github.com/zhangkaixu/minitools.git
文档: https://minitools.readthedocs.org/en/latest/ (里面的数学公式还不能正常显示)
已编写的工具有:
- 感知器模型
perceptron.py
- 中文分词模型
cws.py
- 无监督数据分析
- k均值聚类算法
k-means.py
- 主成分分析(PCA)
pca.py
- LDA主题模型
lda.py
- k均值聚类算法