Os códigos contagem_musicas_portugues.ipynb
e contagem_musicas_ingles.ipynb
contam quantas palavras uma única música tem. Há diferença no código de um idioma para o outro por conta de as estruturas do HTML das páginas serem diferentes.
O código contagem_musicas_csv.ipynb
conta quantas vezes cada palavra se repetiu em uma lista de músicas no arquivo musicas.csv
e gera o CSV palavras_repetidas_musicas.csv
.
Ao executar o programa, contagem_musicas_csv.ipynb
e musicas.csv
devem estar no mesmo diretório.
Observações:
- Usei o site do Vagalume para escrever o código e a raspagem só funciona com esse site
- Para adicionar letras de músicas à planilha
musicas.csv
, usar links do Vagalume - O código exige que, antes, sejam instaladas as bibliotecas
BeautifulSoup4
eRequests