Recuperação de Músicas com Aprendizado de Máquina

Sobre o Projeto

Este projeto foi desenvolvido como parte da disciplina Introdução à Modelagem e Aprendizado no curso de Engenharia de Computação da UTFPR - Curitiba. O objetivo é explorar métodos de Aprendizado de Máquina aplicados à recuperação de músicas, inspirando-se no funcionamento do Shazam.

Tecnologias Utilizadas

Python para web scraping e extração de features
Bibliotecas de Processamento de Áudio: TSFEL e Open3L
Orange3 para análise de dados e modelagem
Selenium e Youtube-dl para obtenção de áudios
Redução de Dimensionalidade com PCA
Classificação e Clusterização utilizando K-Means, Regressão Logística e outras técnicas

Metodologia

Coleta de Dados: Uso de web scraping para baixar listas de músicas populares e extrair os áudios do YouTube.
Extração de Features: Comparação entre métodos estatísticos (TSFEL) e redes neurais (Open3L) para obtenção de embeddings de áudio.
Análise de Clusters: Aplicação de K-Means e avaliação da separabilidade dos dados.
Classificação: Treinamento de modelos para associar músicas baseando-se nas features extraídas.
Redução de Dimensionalidade: Uso de PCA e seleção de features para otimizar o desempenho dos modelos.
Validação: Comparação dos resultados obtidos pelos diferentes métodos e análise qualitativa das previsões.

Resultados

Extração de features resultou em um conjunto de 3500 músicas para análise.
Modelos baseados em Open3L apresentaram melhor agrupamento das músicas.
Redução de Dimensionalidade melhorou o desempenho dos classificadores.
O sistema identificou similaridades musicais inesperadas, demonstrando a viabilidade do método.

Como Executar o Projeto

Instalar Dependências:

pip install selenium youtube-dl tsfel orange3

Executar o Web Scraping:
```
python scrape_songs.py
```
Processar os Áudios:
```
python extract_features.py
```
Treinar e Avaliar os Modelos:
```
python train_model.py
```

Autores

Enzo Holzmann Gaio
Orientador: Prof. Dr. Heitor Silvério Lopes

Licença

Este projeto está licenciado sob a licença MIT.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
teste_2		teste_2
teste_dim		teste_dim
README.md		README.md
feature_th.py		feature_th.py
features.py		features.py
scrap.py		scrap.py
table_data.csv		table_data.csv
test.py		test.py
teste1.py		teste1.py
youtube_results.csv		youtube_results.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Recuperação de Músicas com Aprendizado de Máquina

Sobre o Projeto

Tecnologias Utilizadas

Metodologia

Resultados

Como Executar o Projeto

Autores

Licença

About

Releases

Packages

Languages

ehg2004/musicRetrieval

Folders and files

Latest commit

History

Repository files navigation

Recuperação de Músicas com Aprendizado de Máquina

Sobre o Projeto

Tecnologias Utilizadas

Metodologia

Resultados

Como Executar o Projeto

Autores

Licença

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages