Skip to content

kairen/learning-spark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spark training

本項目將所有於分享會以及課程上,所接觸的系統建置、Spark API 撰寫、HDFS 操作...等教學與整理,主要授課人員為 NUTC imac 內部團隊自我訓練。

主要包含項目

  1. Spark 概念、部署與基本範例
  2. Hadoop 概念、部署與基本範例
  3. Spark 與 Hadoop 相關系統建置整理

以上內容我們會逐一整理,並寫成文件來分享給大家。

參與貢獻

任何團隊成員都可以對該 git 做貢獻,未來也會請大家針對不一樣的作業進行提交,一個基本的貢獻流程如下所示:

  1. Githubfork 到自己的 Repository,例如:<User>/learning-spark.git,然後 clone到 local 端,並設定 Git 使用者資訊。
git clone https://github.com/kairen/learning-spark.git
cd spark-tutorial
git config user.name "User"
git config user.email [email protected]
  1. 修改程式碼或頁面後,透過 commit 來提交到自己的 Repository:
git commit -am "Fix issue #1: change helo to hello"
git push

若新增採用一般文字訊息,如Add Spark MLlib example ...

  1. 在 GitHub 上提交一個 Pull Request。
  2. 持續的針對 Project Repository 進行更新內容:
git remote add upstream https://github.com/kairen/learning-spark.git
git fetch upstream
git checkout master
git rebase upstream/master
git push -f origin master

About

Tidy up Spark and Hadoop tutorials.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •