- 下載SPAM ARCHIVE從2010~2015年的資料
- 使用LogStash進行資料拋轉的工作
- 匯入至ElasticSearch
- 使用Kibana做統計圖表
- 取出5種屬性,轉成data matrix
- 部署分散式Hadoop,執行K-means演算法
資工碩一 m10315095 張清鈞
四資工四 b10015016 吳柏毅
四資工四 b10015027 李信融
Link: https://docs.google.com/document/d/1PsJUfUK5neryj133OTf85cEcQ706xtJddM78eA4tSus/edit?usp=sharing
Link: https://github.com/hwaohung/spam-analysis/blob/master/kibana-result.png?raw=true