ANÁLISE EXPLORATÓRIA DOS REGISTROS DE SOFTWARE DO INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL (INPI)
Os Itens encontrados nesse diretório submetem-se a necessidate de atender ao trabalho de pesquisa do aluno, Felipe Rafael Barbosa, cuja finalidade é a conclusão do trabalho de curso de Bacharelado em Ciência da Computação e à possíveis consultas que possivelmente surgirão.
À medida que a tecnologia vem evoluindo, novos softwares e hardwares ganham espaço em meio a sociedade principalmente entre desenvolvedores e o meio empresarial. Dessa forma, este trabalho de pesquisa realiza uma análise exploratória dos dados armazenados pelo INPI, para verificar a quantidade de registros de software nos anos de 2018, 2019 e 2020. Para isso, a técnica ETL para a referida análise foi realizada, junto com Python e MySQL, e posteriormente sumarizar o conhecimento extraído através de gráficos de barras e nuvens de palavras. Logo, observou-se que o ano de 2019 foi o ano com maior índice de registros validados, seguido pelo ano posterior, que estimulou a necessidade de analisar os ano citados por semestres. Verificou-se também que as tecnologias mais utilizada nos registros são linguagens de programação muito presentes em estruturas focadas em atender simultaneamente as demandas desktop, web e mobile.
Palavras-chave: Registro. Software. ETL. Análise Exploratória.
As technology has evolved, new software and hardware gain space in society, especially between developers and the business environment. Thus, this research work performs an exploratory analysis of the data stored by the INPI, to verify the amount of software records in the years 2018, 2019 and 2020. For this, the ETL technique for the aforementioned analysis was performed, together with Python and MySQL, and later to summarize the knowledge extracted through bar graphs and word clouds. Therefore, it was observed that the year 2019 was the year with the highest rate of validated records, followed by the subsequent year, which stimulated the need to analyze the cited years by semester. It was also found that the technologies most used in the records are programming languages very present in structures focused on meeting desktop, web and mobile demands simultaneously.
Keyword: Records. Software. ETL. Exploratory Analysis.
Este estudo tem como objetivo realizar uma análise exploratória dos dados referentes aos registros de software do INPI dos anos de 2018, 2019 e 2020.
- Buscar os recursos que serão necessários no desenvolvimento do trabalho na coleção de dados do INPI;
- Desenvolver um script em Python responsável em tratar as informações e disponibiliza-lo em uma plataforma de hospedagem de código-fonte;
- Fazer consultas da base de conhecimento utilizando SQL e disponibilizar o código das consultas (Query) em uma plataforma de hospedagem de código-fonte.
- Desenvolver e disponibilizar o script responsável em apresentar frequências utilizando o conceito de nuvem de palavras.
- Representar a base de conhecimento utilizando gráficos de colunas e barras através dos recursos do Google Sheets.
Links importantes para acompanhar a leitura ou realizar o experimento do trabalho.
- O trabalho deu origem ao artigo que pode ser acompanhado em: http://conjecturas.org/index.php/edicoes/article/view/540
- INPI:https://www.gov.br/inpi/pt-br/acesso-a-informacao/dados-abertos/arquivos/documentos/pedidos-de-registro-de-programas-de-computador
- PBDA 2018: https://dados.gov.br/dataset/bw-pc-2018
- PBDA 2019: https://dados.gov.br/dataset/bw-pc-2019
- PBDA 2020: https://dados.gov.br/dataset/bw-pc-2020
- LEGENDAS Campos de Aplicação: https://www.gov.br/inpi/pt-br/assuntos/programas-de-computador/campo_de_aplicacao.pdf/view
- LEGENDAS Tipos de Programa: https://www.gov.br/inpi/pt-br/assuntos/programas-de-computador/tipos_de_programa.pdf/view