Проект представлен в виде 4-ех Jupyter-ноутбков и датасетов.
GD_vote_results_parser.ipynb - парсер данных с web-версии сайта http://vote.duma.gov.ru/
GD_vote_results-Correlation.ipynb - проверка корреляций между дипутатами
GD_vote_results-Clusterring.ipynb - ML-кластеризация депутатов по партиям
GD_vote_results-tf_idf.ipynb - прогноз итогов голосования на основе текста вопроса голосования
dep_df_cr.csv - список депутатов с их партийной принадлежностью
df_full_cr.csv - основной датасет с результатами голосования. Голоса зашифрованы следующими значениями: 2 - не голосовал, 1 - "против", 0 - "воздержался", -1 - "за"
df_full_cr_0.csv - в данном датасеты все значения 2 заменены на 0.