Выполненные учебные проекты из курса "Аналитик данных" школы Яндекс.Практикум
Название проекта | Описание | Инструменты | Библиотеки |
---|---|---|---|
1. Музыка больших городов | Сравнение предпочтений жителей двух мегаполисов на примере данных стримингового сервиса. Оценка зависимости предпочтений от дня недели и локации пользователя | обработка данных, дубликаты, пропуски, логическая индексация, группировка, сортировка | pandas |
2. Исследование надёжности заёмщиков | Создание способа оценки влияния социально-демографических факторов на возврат кредита в срок | обработка данных, дубликаты, пропуски, категоризация, декомпозиция | pandas |
3. Анализ рынка недвижимости Санкт-Петербурга | Определение факторов, влияющих на рыночную стоимость квартиры | обработка данных, histogram, boxplot, категоризация, scatterplot | pandas, matplotlib, numpy |
4. Исследование тарифов телеком-компании | Анализ поведения пользователей мобильного оператора с целью определения более выгодного тарифа и дальнейшего развития тарифной политики. | обработка данных, histogram, boxplot, статистический тест | pandas, numpy, matplotlib, seaborn, scipy |
5. Исследование продаж в игровой индустрии | Изучение факторов успешности компьютерных игр на примере различных игровых платформ. | обработка данных, histogram, boxplot, статистический тест, критерий Стьюдента, piechart | pandas, math, numpy, seaborn, matplotlib, scipy |
6. Оценка эффективности рекламы при продвижении приложения | При помощи методов когортного анализа определение причин плохой окупаемости рекламной кампании мобильного приложения | обработка данных, статистический тест, LTV, CAC, когортный анализ | pandas, numpy, seaborn, matplotlib, datetime |
7. Исследование гипотез для увеличения выручки магазина | На основе данных интернет-магазина приоретизация гипотез и оценка результатов A/B тестирования | A/B-тест, статистический тест, фреймворки RICE, ICE | pandas, math, numpy, seaborn, matplotlib, scipy |
8. Исследование рынка общественного питания в Москве | Исследование рынка общественного питания на открытых данных, подготовка презентации | обработка данных, визуализация данных, создание презентаций | pandas, numpy, seaborn, matplotlib |
9. Анализ поведения пользователей мобильного приложения | На основе данных использования мобильного приложения построение воронки продаж и оценка результатов A/A/B тестирования | A/B-тест, визуализация, статистический тест | pandas, math, numpy, seaborn, matplotlib, scipy |
10. Построение дашборда на основе данных агрегатора новостей | Автоматизация сбора и визуализации данных агрегатора новостей | дашборд, пайплайн, Tableau | pandas, sqlalchemy |
11. Прогнозирование вероятности оттока пользователей для фитнес-центров | Спрогнозировать вероятность оттока для каждого клиента фитнес-центра в следующем месяце, сформировать с помощью кластеризации портреты пользователей | KMeans, Machine Learning, дендрограмма, RandomForestClassifier, LogisticRegression | pandas, numpy, matplotlib, seaborn, scipy, sklearn, datetime |
12. Оценка результатов A/B-теста внедрения улучшений рекомендательной системы | Оценить корректность проведения А/B-теста и изучить результаты эксперимента | A/B-тест, визуализация, статистический тест | pandas, math, numpy, seaborn, matplotlib, scipy, plotly |
13. Анализ базы данных книжного магазина | SQL-средствами изучить базу данных книжного магазина | SQL | pandas, sqlalchemy |
14. Выделение групп пользователей мобильного приложения на основе поведения | Выделить группы пользователей приложения, которые различаются по четырем метрикам (retention rate, время, проведённое в приложении, частота действий, конверсия в целевое действие) | KMeans, дендрограмма, кластеризация, RandomForestClassifier, LogisticRegression | pandas, math, numpy, seaborn, matplotlib, scipy, plotly, sklearn |