Trabalho realizado para a disciplina PMR3508 - USP.
O objetivo do projeto é fazer um classificador para variável 'Target' do dataset Adult, presente no UCI Repository. Para sua realização foram divididas etapas, iniciando por realizar a exploração dos dados, em que observa-se como são distribuídas as variáveis do dataset, quais valores elas assumem etc; avaliar o impacto da seleção de variáveis e feature engineering e seleção do parâmetro K, do algoritmo K-Nearest Neighbors(KNN), sobre a acurácia do classificador feito.
Linguagem: Python
Obs. Os datasets utilizados no código foram retirados da página do Kaggle da disciplina, em que estão já separados em dataset de treino e de teste para o classificador. A variável nestes datasets está com o nome 'income'.