por:
@profadolfoguimaraes
Esse projeto foi resultado de um minicurso de coleta de dados do twitter ministrado em 2016. Em março de 2018, resolvi retomá-lo para ministrar novamente. Na ocasião foram coletados em torno de 600 tweets com as hashtags #teambatman e #teamsuperman. A proposta do minicurso é coletar os dados, fazer um rápido pré-processamento e exibir as informações em uma página web.
O material completo desse minicurso pode ser encontrado no site: http://www.data2learning.com/cursos
O projeto está dividido em dois repositórios:
- d2l-minicursotwitter-notebook
(este repositorio)
: possui todos os jupyter notebooks de explicação do conteúdo abordado no minicurso. - d2l-minicursortwitte-web: possui a página web criada para visualizar as informações coletadas do twitter.
Para o projeto funcionar é necessário instalar algumas depedências que estão listadas no arquivo requirements.txt
. Para
instalar utilize o comando:
pip install -r requirements.txt
O projeto utiliza python versão 3.x.
Para usar a API do Twitter é preciso se cadastrar em apps.twitter.com e criar um App para obter
as credenciais: Keys e Tokens. No código todas as credenciais estão como None
. Esse valor deve ser substituído pelas credenciais
obtidas no site do twitter. Uma breve explicação de como obter tais credenciais
pode ser encontrada nos slides disponibilizados neste link.
Para editar os notebooks é preciso instalar o Jupyter Notebook. Informações em: http://jupyter.org/
- Slides: Slides da parte introdutória do minicurso.
- Coletando dados do twitter (Parte 1)
- Coletando dados do twitter (Parte 2)
- Pré-processamento utilizando NLTK
- Análise do Texto
Os notebooks podem ser executados no Colab Google Research. Acesse os notebooks pelo link a seguir e faça uma cópida para o Google Drive.
- Coletando dados do twitter (Parte 1)
- Coletando dados do twitter (Parte 2)
- Pré-processamento utilizando NLTK
- Análise do Texto
Qualquer dúvida e/ou sugestões, entre em contato:
e-mail:
[email protected]
instagram:
@profadolfoguimaraes