Skip to content

Latest commit

 

History

History
 
 

Science and Data Analysis

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Science and Data Analysis

关于科学计算和数据分析……

说明

  • 如何使用Python和Pandas处理大量的JSON数据集

    如何处理大量的(指无法一次性存入内存)JSON数据集呢?本文给出了一个第三方库ijson来迭代的处理此问题。同时,通过一个简单的交通管制数据的分析,向我们娓娓道来如何使用Pandas处理分析可视化数据……

  • 新闻标题分析

    这个项目分析两个记者写的新闻标题 —— 一个是来自于Business Inside的财政记者,一个是来自于Huffington post的名人记者 —— 来寻找这两个记者为他们的新闻文章和博客编写标题之间的异同。

  • 使用矩阵分解找到相似歌曲

    本文一步步指导如何使用几个不同的矩阵分解算法来计算相关的艺术家。代码使用Python编写的,使用PandasSciPy来进行计算,使用D3.js来交互式可视化结果。

    这篇文章的样式惨不忍睹,建议还是跟原文一起对着看……

  • Python中的并行处理

    虽然像C, Java, 和R这样的语言允许相当容易地进行并行处理,但对于Python程序员来说,因为全局解释锁(GIL)的存在,这却没那么容易。幸好作为pythoner的我们,也并非一筹莫展!

  • [Matplotlib教程 - 绘制提到Trump, Clinton & Sanders的推特](./Matplotlib教程 - 绘制提到Trump, Clinton & Sanders的推特.md)

    一篇手把手教你的Matplotlib教程,是一篇很不错的learn-by-doing的数据分析文章!!

  • [使用Pandas, Docker和OS(R)M来猜测神秘的旅行地](./使用Pandas, Docker和OS(R)M来猜测神秘的旅行地.md)

    如果你准备去某个神秘的地方玩,关于这个地方有几点提示,那么可以看看如何利用Pandas, Docker和OS(R)M科学有效的进行排除猜测。

  • 使用BigQuery和TensorFlow进行需求预测

    在本notebook中,我们将开发一个机器学习模型,用于预测对纽约的出租汽车需求。

  • Python中一个简单的基于内容的推荐引擎

  • 在Python中实现你自己的推荐系统

  • 分析权力游戏图表

    帅爆了,用科学方法,分析权力游戏中错综复杂的人物关系。本文只实验了第三卷,看过之后,可以用其他卷来重现该实验~

  • 使用Python探索NFL选秀

  • 用于格式化和数据清理的便捷Python库

  • 分析iPhone步数数据

    本文展示了如何使用pandas timeseries和ggplot来分析iPhone步数数据。

  • 使用Python,分析23AndMe数据,获取遗传起源

    你的DNA包含了关于你的主线,易患疾病以及复杂特性,包括身高、体重、五官和行为等丰富的信息。使用来自23andMe,一家直接面向消费者的遗传学公司,的公众可获取数据,我们将展示如何确定在网上找到的来自23andMe的一份匿名样本的祖先。

  • [用Python进行股票市场数据分析概述 (第一部分)](./用Python进行股票市场数据分析概述 (第一部分).md)

    这篇文章是使用Python进行股票数据分析系列的两部分中的第一个部分,基于我在Utah大学为MATH 3900(数据科学)课题提供的一个讲座。在这些文章中,我会讨论到基础知识,例如使用pandas从Yahoo! Finance获取数据,可视化股票数据,移动均值,制定一个移动平均交叉策略,回测和基准。最后的一篇文章会包含实际问题。这第一篇文章讨论的主题到介绍移动均值。