Skip to content

📊📈👩🏻‍💻Machine Learning Project using Logistic regression to predict whether or not a user has clicked on an online ad

Notifications You must be signed in to change notification settings

inesarruda/Logistic_Regression

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

Machine Learning Project - Logistic Regression

Machine Learning Project using Logistic regression to predict whether or not a user has clicked on an online ad

Projeto Regressão Logística - Machine Learning

Nesse projeto vamos trabalhar com um conjunto de dados fictício, que indica se um usuário clicou ou não em um anúncio online. A partir disso, vamos criar um modelo para prever se o usuário, baseado em suas características, vai clicar ou não no anúncio. O modelo de machine learning que será utilizado será uma regressão logística.

O dataset contém as seguintes features:

  • 'Daily Time Spent on Site': tempo do consumidor no site em minutos
  • 'Age': Idade do cliente em anos
  • 'Area Income': Renda média da área geográfica do consumidor
  • 'Daily Internet Usage': Média de minutos que o consumidor gasta na internet
  • 'Ad Topic Line': Título do anúncio
  • 'City': Cidade do consumidor
  • 'Male': Se o consumidor era um Homem
  • 'Country': País do consumidor
  • 'Timestamp': Hora em que o consumidor clicou no anúncio ou em fechar a janela
  • 'Clicked on Ad': 0 or 1 indicando se o consumidor clicou no anúncio

image

Vamos fazer mais algumas análises estatísticas, para isso vamos olhar um mapa de calor com as correlações entre as features, e vamos demonstrar algumas delas através de gráficos

image

Vimos também que idade e uso de internet tem uma correlação negativa, ou seja, quanto menor a idade mais internet se usa diariamente e vice-versa.

image

Vemos que o gráfico acima realmente apresenta dois "nichos". No lado esquedo superior temos o grupo de menor idade e com maior uso de internet, enquanto no lado direito inferior temos maior idade e menor uso de internet.

Vimos que há uma alta correlação entre idade e clicar nos anúncios. Vamos então separar as idades em faixas e verficar o comportamento.

Para separar de em faixas de idade, vamos utilizar o comando cut

image

Nota-se que quanto maior a idade, maior a tendência em clicar nos anúncios da página.

Essa análise é importante para entender a melhor estratégia de propaganda de acordo com o público.

Regressão Logística

Vamos começar divivindo o dataset nos dados de treino e teste. Também vamos definir as features e o target que serão utilizados

image

Colocando as métricas em uma Matriz de Confusão

image

A análise completa está disponível no notebook "Projeto Regressão Logística - Inês.ipynb" deste repositório

About

📊📈👩🏻‍💻Machine Learning Project using Logistic regression to predict whether or not a user has clicked on an online ad

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published