Kaggle (Pima Indians Diabetes Database - Predict the onset of diabetes based on diagnostic measures)
Aplicação web feito em linguagem Python utilizando o Framework Streamlit para análises preditivas de Diabetes utilizando conceitos de Inteligencia Artificial e Machine Learning.
A aplicação analisa as chances de contágio da Diabetes uma vez que os dados são computados e treinados por uma base de dados em ".csv" para testar a precisão das informações obtidas através de inputs do usuário, o algoritmo treinado conclui uma acurácia de aproximadamente 80%.
Projeto baseado no desafio do Kaggle para consolidar meus conhecimentos na área de Data Science, Inteligencia Artificial e Machine Learning.
Base de dados de arquivo de texto separado por vírgulas (.csv), tendo como fonte principal o site [Kaggle](https://www.kaggle.com/uciml/pima-indians-diabetes-database) . Este Dataset é originalmente do Instituto Nacional de Diabetes e Doenças Digestivas e Renais (NIDDK), sendo uma coleta de dados da tribo de Índios Americanos chamada Pima e este projeto é baseado no estudo destes dados.
O objetivo do conjunto de dados é prever com diagnóstico se um paciente tem diabetes ou não, com base em certas medidas diagnósticas incluídas no conjunto de dados. Várias restrições foram colocadas na seleção dessas instâncias de um banco de dados maior..
Projeto construído com base no protótipo feito no site "Everything Computer Science", seguindo estas etapas:
-
Acesso ao site do Kaggle para download do Dataset "Diabetes.csv".
-
Instalação do Anaconda
-
Instalação do PyCharm
-
Instalação do Framework Streamlit
-
Criação do código fonte e importação das bibliotecas e pacotes utilizados
-
Bibliotecas Python utilizadas:
- NumPy
- Pandas
- PIL (Python Image Library)
- Scikit-Learn
- Streamlit
-
Inicialização do WebApp
Vá no Prompt de Comando e digite "pip install streamlit"
-
Configurações do meu computador pessoal utilizado neste projeto:
- Sistema Operacional: Windows 10 - 64 bits
- Processador: Intel(R) Core(TM) i7-5500U CPU @ 2,40GHz 2,40GHz
- Memória: 8,00 GB
- HD: SSD 250 GB
-
Softwares.
- Git: Utilizado para fazer o controle de versão do código gerado ao longo do projeto;
- Github Desktop: Utilizado para fazer a interface do Git para controle de versão do código gerado ao longo do projeto;
- Notepad: Geração e edição dos arquivos ".txt", ".md";
- Anaconda3: Ambiente de utilização do Python e seus pacotes;
- PyCharm: IDE para geração e edição de código fonte Python ".py";
- CMD ou PowerShell: Utilizado para scripts de instalação de pacotes do Streamlit, chamada e inicialização do WebApp.
- Google Chrome: Browser para exibição do WebApp.
- Eveything Computer Science
- Pima Indians Diabetes Database
- Kaggle
- National Institute of Diabetes and Digestive and Kidney Diseases
MIT License Copyright (c) 2020 Aron Marcus




