Skip to content

使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析

Notifications You must be signed in to change notification settings

pengxiaohua/analysis-of-bikeshare-data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

analysis-of-bikeshare-data

使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析

自行车共享数据

在过去十年内,自行车共享系统的数量不断增多,并且在全球多个城市内越来越受欢迎。自行车共享系统使用户能够按照一定的金额在短时间内租赁自行车。用户可以在 A 处借自行车,并在 B 处还车,或者他们只是想骑一下,也可以在同一地点还车。每辆自行车每天可以供多位用户使用。

由于信息技术的迅猛发展,共享系统的用户可以轻松地访问系统中的基座并解锁或还回自行车。这些技术还提供了大量数据,使我们能够探索这些自行车共享系统的使用情况。

在此项目中,使用 Motivate 提供的数据探索自行车共享使用模式,Motivate 是一家入驻美国很多大型城市的自行车共享系统。比较以下三座城市的系统使用情况:芝加哥、纽约市和华盛顿特区。

数据集

有三座城市 2017 年上半年的数据。三个数据文件都包含相同的核心六 (6) 列:

  • 起始时间 Start Time(例如 2017-01-01 00:07:57)

  • 结束时间 End Time(例如 2017-01-01 00:20:53)

  • 骑行时长 Trip Duration(例如 776 秒)

  • 起始车站 Start Station(例如百老汇街和巴里大道)

  • 结束车站 End Station(例如塞奇威克街和北大道)

  • 用户类型 User Type(订阅者 Subscriber/Registered 或客户Customer/Casual) 芝加哥和纽约市文件还包含以下两列:

  • 性别 Gender

  • 出生年份 Birth Year

问题

主要处理以下关于自行车共享数据的问题:

  • 起始时间(Start Time 列)中哪个月份最常见?
  • 起始时间中,一周的哪一天(比如 Monday, Tuesday)最常见? 提示:可以使用 datetime.weekday() (点击查看文档)
  • 起始时间中,一天当中哪个小时最常见?
  • 总骑行时长(Trip Duration)是多久,平均骑行时长是多久?
  • 哪个起始车站(Start Station)最热门,哪个结束车站(End Station)最热门?
  • 哪一趟行程最热门(即,哪一个起始站点与结束站点的组合最热门)?
  • 每种用户类型有多少人?
  • 每种性别有多少人?
  • 出生年份最早的是哪一年、最晚的是哪一年,最常见的是哪一年?

文件

  • bikeshare.py
  • chicago.csv
  • new_york_city.csv
  • washington.csv

About

使用Pandas对芝加哥、纽约市和华盛顿特区的共享自行车数据进行一个简单的分析

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages