Skip to content

Files

Latest commit

be81a8b · Nov 17, 2020

History

History
This branch is up to date with datawhalechina/team-learning-data-mining:master.

HandsOnDataAnalysis

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
Nov 17, 2020

动手学数据分析

开源内容:https://github.com/datawhalechina/hands-on-data-analysis

基本信息

  • 学习周期:10天,每天学习3~5个小时
  • 学习形式:使用jupyter完成课程版块的内容,并做笔记或者写博客。
  • 人群定位:懂一些python,希望入门数据分析的学习者。
  • 先修内容:Python编程语言编程实践(Pandas)
  • 难度系数:低

学习目标

了解数据分析中基本库的操作(比如:pandas,numpy和matplotlib);熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。

任务安排

Task01:数据加载及探索性数据分析(2天)

  • 了解数据加载以及数据观察
  • 掌握pandas基础
  • 完成探索性数据分析

主要学习内容是:课程的第一章

Task02:数据清洗及特征处理(2天)

  • 掌握数据清洗的方法
  • 了解特征观察与处理

主要学习内容是:课程的第二章的第一部分(数据清洗及特征处理)

Task03:数据重构(2天)

  • 了解数据重构的方法
  • 使用groupby做数据运算

主要学习内容是:课程的第二章第二和第三部分(数据重构)

Task04:数据可视化(2天)

  • 了解可视化的目的
  • 知道各种图形可用于的场景
  • 实战数据可视化的基本库

主要学习内容是:课程的第二章第四部分(数据可视化)

Task05:数据建模及模型评估(2天)

  • 了解数据建模
  • 使用sklearn完成分类模型的建模
  • 了解模型评估
  • 使用sklearn完成模型评估

主要学习内容是:课程的第三章(数据建模及模型评估)


贡献人员

姓名 博客 备注
陈安东 GitHub知乎 中央民族大学研究生
金娟娟 知乎 浙江大学硕士 业务与数据分析师
李玲 知乎 算法工程师
老表 微信公众号:简说Python 数据分析爱好者
杨佳达 Github 数据挖掘师
张文涛 Github 中山大学博士研究生
高立业 Github 太原理工大学研究生