Pada pekerjaan ini dilakukan pembuatan machine learning clustering dari sebuah dataset. Dataset ini berisi data customer sebuah perusahaan penerbangan dan beberapa fitur yang dapat menggambarkan value tersebut. Gambar dibawah menunjukkan deskripsi dataset dan hasil clustering.
- requirements.txt : package yang digunakan pada model
- eda_preprocessing_model.ipynb : proses tahap eda hingga menjadi model
- flight.csv : dataset yang digunakan
- README.md : report tahapan
- Download data here
- Instalasi dengan
pip install requirements.txt
- Exploratory Data Analysis, dilakukan proses cek duplikat, cek nilai null, mengecek deskripsi data apakah ada yang aneh atau tidak, cek data outlier, cek korelasi, distribusi dan redundan.
- Preprocessing, hasil dari pengamatan EDA selanjutnya diselesaikan di tahapan ini. Tahapan yang dilakukan pada proses ini yaitu data cleansing, feature selection, scaling
- Model, pada proses ini dilakukan pembuatan model untuk unsupervised learning - K-means Clustering. Kemudian, hasil dari K-means Clustering dievaluasi menggunakan Elbow Method dan Silhouette hasilnya jumlah clustering yang optimal adalah 4 cluster.
Dari hasil clustering tersebut, kami lakukan interpretasi perbedaan dari masing-masing cluster.
Kami lakukan pengelompokan sebagai berikut
- Cluster 0 : menunjukkan customer yang sudah bergabung sekitar hampir 7 tahun, jarang melakukan penerbangan dan jarak penerbangan yang dilakukan tidak jauh (retained customer)
- Cluster 1 : menunjukkan customer yang sudah bergabung sekitar hampir 5 tahun, aktif dalam menggunakan jasa penerbangan dan sering berpergian dengan jarak yang cukup jauh (High-value customer)
- Cluster 2 : menunjukkan customer yang sudah bergabung sekitar 2 tahun (tergolong baru), sering melakukan penerbangan dan jaraknya cukup jauh. (potential customer)
- Cluster 3 : menunjukkan customer yang sudah bergabung sekitar 3 tahun (tergolong baru) namun sangat jarang menggunakan jasa penerbangan dan sekali menggunakan juga tidak terlalu jauh (low-value customer)
Stratei bisnis yang dapat disusun sebagai berikut.
- Membuat sebuah skema reward untuk pelanggan loyal yang sering menggunakan jasa penerbangan dan skema tersebut dapat meningkat seiring meningkatnya pengeluaran yang dilakukan oleh customer, sehingga customer yang loyal ini merasa memiliki target untuk mengejar skema reward yang lebih tinggi yang menurutnya menguntungkan dan juga menguntungkan bagi perusahaan.
- Membuat sebuah sistem promo secara general (untuk keseluruhan customer) dalam bentuk voucher yang memiliki kode unik yang semakin cepat diklaim maka nilai potongannya cukup besar (untuk memancing customer menggunakan jasa penerbangan lebih sering agar frekuensi penggunaan jasanya meningkat) dan berlaku juga sebaliknya (semakin lama diklaim semakin kecil nilai potongannya)