ПЕРЕД ЗАПУСКОМ HW4.ipynb
- Убедитесь, что читаете датасет из правильной директории
- В ноутбуке используются библиотеки:
- pandas
- numpy
- matplotlib
- seaborn
- plotly
- sklearn
- yellowbrick
Убедитесь, что они установлены в вашей среде выполнения
СЕГМЕНТАЦИЯ КЛИЕНТОВ
Сегментация клиентов — это подробный анализ идеальных клиентов компании. Это помогает бизнесу лучше понять своих клиентов и облегчает им модификацию продуктов в соответствии с конкретными потребностями, поведением и проблемами различных типов клиентов.
Сегментация клиентов помогает бизнесу модифицировать свой продукт на основе целевых клиентов из разных типов клиентских сегментов. Например, вместо того, чтобы тратить деньги на открытие новых магазинов, компания может улучшить сервис доставки товаров для клиентов, которые предпочитают преимущественно интернет-покупки.
ОПИСАНИЕ ПРОЕКТА И ВЫВОДЫ
В данной работе рассмотрен датасет marketing_campaign.scv (также доступен на https://www.kaggle.com/datasets/rodsaldanha/arketing-campaign )
Краткий ход работы:
1. EDA: статистические показатели, визуализация данных
2. Preprocessing: создание и модификация признаков, удаление наименее полезных
3. Анализ разделимости с помощью t-SNE, понижение размерноисти с помощью PCA
4. Кластеризация клиентов с помощью KMeans, анализ наилучшего число кластеров, обучение модели с помощью RandomForest
По итогам проекта мы получили 4 кластера, характерными отличиями между которыми являются:
- уровень дохода
- уровень покупки за одно посещение
- количество человек в семье
- предпочтение онлайн или оффлайн покупок
- частота совершения покупок
Какие покупатели приносят больше всего денег и какое направление развития выбрать:
Исходя из проведенного анализа - большую часть дохода приносят клиенты, которые совершают покупки непосредственно в магазине. В первую очередь нужно направить усилия для улучшения взаимоотношений с этим кластером - улучшить привлекательность магазинов, удобство пребывания и совершения платежей и т.д.