Skip to content

Repositório para estudo de limpeza de dados e armazenamento de scripts e funções úteis para limpeza de dados com projeto prático.

Notifications You must be signed in to change notification settings

alletsc/data_cleaning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

🧑🏽‍💼 Análise e limpeza de dados de telecomunicações 🐍

Sobre

O objetivo deste projeto é realizar a análise e limpeza de dados de telecomunicações. Me utilizo de tecnica de limpeza de dados para tratar os dados faltantes, outliers e dados duplicados tudo isso fazendo uso de funções que foram criadas para tal.

🧹 Etapas de Limpeza de Dados

  • Converter dados para o tipo correto
  • Tratar dados faltantes
  • Tratar outliers

Ferramentas na pasta utils

Esta pasta contém 3 arquvios com funções que podem ser usadas para limpar os dados.

Os arquivos e funções são:

  • conversao_dados.py

    • convert_to_string
    • convert_to_int
    • convert_to_datetime
    • convert_to_factor
  • trat_outliers.py

    • remove_outliers
    • replace_outliers_with_fences
    • getOveview
  • valores_ausentes.py

    • func_calc_percentual_valores_ausentes: Calcula o percentual de valores ausentes em um DataFrame
    • func_calc_percentual_valores_ausentes_linha: calcula o percentual de linhas com valores ausentes
    • func_calc_percentual_valores_ausentes_coluna: calcula valores ausentes por coluna
    • fix_missing_ffill: Imputação de valores ausentes usando forward fill (preenchimento progressivo) - preenche com o próximo valor válido
    • fix_missing_bfill: Imputação de valores ausentes usando backward fill (preenchimento regressivo) - preenche com o último valor válido
    • fix_missing_median: Imputação usando a mediana
    • fix_missing_value: Preenche valor NA
    • drop_duplicates: Remove linhas duplicadas
    • drop_rows_with_missing_values: Drop de linhas com valores ausentes
    • drop_columns: Drop de colunas

About

Repositório para estudo de limpeza de dados e armazenamento de scripts e funções úteis para limpeza de dados com projeto prático.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published