Hello!这是我的学习笔记,主要是ML、DL、RL、CV、NLP、RS等AI相关的内容。笔记的仓库可以直接下载下来看,无需经由我同意。但是请不要用于学习之外的用途(比如不标注出处的转载、商业用途、大篇幅抄袭等),少量引用可以不注明出处,引用多了还是希望能注明出处是virtual小满 https://github.com/virtualxiaoman/MLDLRL
。
Attention! 已经上线在线阅读版,可见https://virtualxiaoman.github.io/blog/
比较推荐查看:
├── 数学基础.pdf [√]可以作为查阅。主要是线代与概率论,参考的鸢尾花书、雷明。未来可能重构与更新(可能考研之后吧)
├── 机器学习.md [正在更新]重写.docx文档,更加深入去了解原理与算法,偏向总结与动手算,后续还会加入项目实践
├── 深度学习.md [正在更新]对深度学习的一些总结,不太基础。
数据分析的代码请参考Easier_DataScience(基本所有的机器学习、深度学习等的代码都会整合到里面去,形成统一而便捷的api调用或是demo,当然估计也不会有人用,哈哈哈;当然里面也有很多demo实践,从笔记的link里跳转过去就行了)。
文件夹说明:
├── assets [√]存放图片
├── 以前的笔记 [√]存放以前的笔记,不再更新,也不是很推荐查看(比较简单)
├── 导出的PDF [√]markdown或者word转为PDF的文件,markdown的主题使用latex
├── 零散东西的笔记 [正在更新]存放一些小笔记
├── 其余笔记 [正在更新]markdown的笔记是最新的,也是最推荐查看的。word是去年写的了,偏向应试。
推荐资料:
- 《鸢尾花书》 - 从加减乘除到机器学习
- 推荐理由:配图极其优秀,整体逻辑比较连贯,原理讲解很棒。我所见过的最想让你看懂的书籍,能看出作者的用心。
- 缺陷:有些啰嗦,没办法速通,代码写的也是一坨,甚至不肯格式化一下。
- 《动手学深度学习》 - 面向中文读者的能运行、可讨论的深度学习教科书,简称d2l
- 推荐理由:深度学习实操,除了部分大一点的模型我的电脑太辣鸡直接爆显存之外,基本都能直接运行,而且原理的讲解确实牛逼,社区也不错。
- 缺陷:虽然是中文,但是很有机翻的感觉。什么都放在d2l.py里了,代码逻辑比较混乱,需要自己重构一部分代码,但是起码也算是我目前见过的代码写得比较好的了。
- 李宏毅深度学习教程 LeeDL Tutorial - 李宏毅的深度学习课程
- 推荐理由:不是入门书,可以先看d2l再看这个。这个书提及了很多细节与问题,更多的是启发性思考,主要是讲解一些深度学习的原理。
- 缺陷:没有代码实现,然后感觉就是他的课的文字版,有些地方都没校验就直接放上去了,需要自己去看源视频。(因为我自己不喜欢看视频来学习,所以我看的是这个书,视频还是很不错的)
- Easier_DataScience - [自荐]我写的一些便于MLDL等AI相关的module或是一些demo,希望调用或复用的时候更方便
- 推荐理由:方便调用,不用每次都写一遍
- 缺陷:还在更新中,有些模块还没写完或者还没测试,部分代码逻辑可能不够清晰,就当是自己的练手了。
- 雷明-机器学习的数学 - 机器学习的数学基础
- 推荐理由:数学推导比较详细,适合想要深入了解的人。
- 缺陷:没图,全是公式。另外目前还没在网上找到电子书,我是买的纸质的。
(好像我格外喜欢电子书,逃~~)(我是Datawhale和d2l的狗~)
没打○的就是我没看过,阿巴阿巴~(没看的未来应该会看的,看完了再更新评价)。
中文社区的资料就这鬼样子,真的烂大街的我肯定不会放上来了。
以下排名分先后(我没看的不算):
- ○AI数学笔记 Liang's Blog
○AI算法工程师手册 huaxiaozhuan
- 比较难的公式推导都有,按需查阅。
- 感觉挺全面的。
- ○动手学ML
- 电子书,免费。
- 不是入门书,适合有一定基础的看。
- 部分公式存在严重错误,但是讲解还可以,需要有自己的判断能力。
- 习题答案可以参考:motewei
- ○文亮-推荐系统技术原理与实践
- 有电子书(需要异步会员,但是异步会员可以通过已经购买了的纸质书兑换),相当于半白嫖。
- 整体讲解还可以,最好搭配FunRec一起看。
- 举例大部分是阿里巴巴的模型,难道阿里巴巴给他打钱了?
- ○动手学NLP
- 无电子版(异步都没电子版),买了纸质书,书挺好的,但我现在被劝退了,我不适合学NLP,感觉NLP的理论不美。
- ○王晓华-从零开始大模型开发与微调:基于PyTorch与ChatGLM
- 有电子版,付费,跟纸质版价格差不多。有神秘链接,但是要快手关注才能拿密码,我又没下。。。
- 这本书不适合0基础,而是适合学了一点之后再看。其号称“通俗易懂”的原因是难的都不讲,都让读者“自行在网上查阅”。
- 没有原理讲解,代码写的屎到不行而且有些感觉直接copy的连注释都是英文(我见过的最烂的),唯一的优势是新且比较实用。
- 动手学CV
- 无电子版,而且github仓库都没建好,纸质书好像也没了,所以我没看
- 动手学RL
- 有电子版,据说好
- 带注释的pytorch论文实现
- 个人感觉翻译得非常差,但是类似的其他资源还没找到更好的
- 强化学习导论
- 人大LLM-Book
- 可下载阅读
以下请避雷:
- 扩散原理从入门到实战-异步图书:没有原理讲解,我看完了还是一知半解的状态,代码是英文原版的机翻。另外其实这是个开源的书,感觉不如看这个开源资料。
- 自动机器学习入门与实践-华中科技大学出版社:没有原理讲解,大部分是ML而非autoML,代码就是英文原版的一个字都没改。
- Datawhale-github或者Datawhale-官网
好像都是免费,质量还挺不错的(但是因为显然每一章节的作者不相同,导致逻辑连贯性不够强、符号使用不太统一),但是感觉最近更新的不多,好的教程似乎都已经是一两年前的了。整体来说,我觉得Datawhale的质量还是比较高的,并且有些教程确实是独一无二的,比如
plt
的我就没在其他地方看到研究得这么细致的。 - boyuai-github或者boyuai-官网 有付费内容,但是动手学系列都是免费的,但是动手学NLP,CV的不知道为什么没有电子书了,所以只有ML,RL有电子书了,唉。
- B站-这是我已经看完了的视频教程的一个收藏夹 主要包括:
- BV1T84y167U9 机器学习(传统的机器学习算法基本都有)。虽然我不推荐看唐宇迪的视频来学机器学习,但是他的视频确实简单,拿个二倍速过一遍当入门就行,不要去纠结其中的代码是怎么写的或者去纠结他公式推导的细节。
- BV1RT411G7jJ 机器学习(侧重统计学习)。内容不是很多,但是讲的都很好
- BV15V411W7VB 机器学习(侧重神经网络)。跟上面一个一样,内容讲的很不错,能启发思考。
- 李沐、李宏毅、吴恩达等大佬的视频,这里不给出链接了,B站一搜就有的,去Youtube看也行。真的比唐宇迪的强很多。
书籍 | 整体印象 | 阅读舒适度 | 实用性 | 逻辑性 | 启发性 | 语言 |
---|---|---|---|---|---|---|
《动手学深度学习》 | 9 | ★★★★★ | ★★★★☆ | ★★★★☆ | ★★★★☆ | ★★★☆☆ |
李宏毅深度学习教程 LeeDL Tutorial | 9 | ★★★★★ | ★★★☆☆ | ★★★★☆ | ★★★★★ | ★★★☆☆ |
《鸢尾花书》 | 8.5 | ★★★★☆ | ★★★☆☆ | ★★★★☆ | ★★★★★ | ★★★★★ |
《机器学习的数学》 | 8 | ★★★☆☆ | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ |
动手学ML | 7 | ★★★☆☆ | ★★★☆☆ | ★★★★☆ | ★★★☆☆ | ★★★☆☆ |
BV1T84y167U9 | 5 | ★★★★☆ | ★★★★☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★★☆☆ |
以上是我觉得还不错的资料的评分。评分十分主观,仅供参考,应当根据自己的学习目的与风格选择适合自己的学习资料。
- 整体印象是我的主观感受。
- 阅读舒适度是能不能让人有继续阅读的冲动。
- 实用性主要是看代码写的好不好。
- 逻辑性主要看作者的思维。
- 启发性主要看作者能否给我带来启发。
- 语言是指作者的语言表达能力,不是指代码的语言。包括:是否是母语或者翻译得是否是个正常人、描述是否清晰、用词是否准确。