开源内容:https://github.com/datawhalechina/hands-on-data-analysis
- 学习周期:10天,每天学习3~5个小时
- 学习形式:使用jupyter完成课程版块的内容,并做笔记或者写博客。
- 人群定位:懂一些python,希望入门数据分析的学习者。
- 先修内容:Python编程语言,编程实践(Pandas)
- 难度系数:低
了解数据分析中基本库的操作(比如:pandas,numpy和matplotlib);熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
- 了解数据加载以及数据观察
- 掌握pandas基础
- 完成探索性数据分析
主要学习内容是:课程的第一章
- 掌握数据清洗的方法
- 了解特征观察与处理
主要学习内容是:课程的第二章的第一部分(数据清洗及特征处理)
- 了解数据重构的方法
- 使用groupby做数据运算
主要学习内容是:课程的第二章第二和第三部分(数据重构)
- 了解可视化的目的
- 知道各种图形可用于的场景
- 实战数据可视化的基本库
主要学习内容是:课程的第二章第四部分(数据可视化)
- 了解数据建模
- 使用sklearn完成分类模型的建模
- 了解模型评估
- 使用sklearn完成模型评估
主要学习内容是:课程的第三章(数据建模及模型评估)
姓名 | 博客 | 备注 |
---|---|---|
陈安东 | GitHub,知乎 | 中央民族大学研究生 |
金娟娟 | 知乎 | 浙江大学硕士 业务与数据分析师 |
李玲 | 知乎 | 算法工程师 |
老表 | 微信公众号:简说Python | 数据分析爱好者 |
杨佳达 | Github | 数据挖掘师 |
张文涛 | Github | 中山大学博士研究生 |
高立业 | Github | 太原理工大学研究生 |