面向程序员的数据挖掘指南

欢迎辞

这是一本用于学习基本数据挖掘知识的书籍。大部分关于数据挖掘的书籍都着重于讲解理论知识，难以理解，让人望而却步。不要误会，这些理论知识还是非常重要的。但如果你是一名程序员，想对数据挖掘做一些了解，一定会需要一本面向初学者的入门书籍。这就是撰写本书的初衷。

这本指南采用“边学边做”的方式编写，因此在阅读本书时，我强烈建议您动手实践每一章结束提供的练习题和实验题，使用书中的Python脚本将其运行起来。书中有一系列展示数据挖掘技术的实例，因此在阅读完本书后，你就能掌握这些技术了。这本书以Creative Commons协议发布，可以免费下载。你可以任意分发这本书的副本，或者重新组织它的内容。也许将来我会提供一本纸质的书籍，不过这里的在线版本永远是免费的。

这本书以PDF格式免费发行，点击下面每一章的标题，您就会被定向到一个页面，其中包含了这一章的PDF文件和示例代码的下载链接。此外，你还可以在这个页面中发表评论，举出书中的问题和错误，哪部分难以理解等。我会根据这些评论来修订本书。

Name		Name	Last commit message	Last commit date
Latest commit History 245 Commits
code		code
img		img
.gitignore		.gitignore
README.md		README.md
chapter-1.md		chapter-1.md
chapter-2.md		chapter-2.md
chapter-3.md		chapter-3.md
chapter-4.md		chapter-4.md
chapter-5.md		chapter-5.md
chapter-6.md		chapter-6.md
chapter-7.md		chapter-7.md
chapter-8.md		chapter-8.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

面向程序员的数据挖掘指南

欢迎辞

目录

第一章：简介

第二章：推荐系统入门

第三章：隐式评价和基于物品的过滤算法

第四章：分类

第五章：进一步探索分类

第六章：朴素贝叶斯

第七章：朴素贝叶斯算法和非结构化文本

第八章：聚类

About

Releases

Packages

Languages

adrianhust/guidetodatamining

Folders and files

Latest commit

History

Repository files navigation

面向程序员的数据挖掘指南

欢迎辞

目录

About

Resources

Stars

Watchers

Forks

Languages