- Juliana Margaret Rojas Guillen | email: [email protected]
- Annagrazia Fiorella Cotrina Pegorari | email: [email protected]
- Jelsin S. Palomino Huaytapuma | email: [email protected]
- Maykol Medrano Ccahuana | email: [email protected]
Adaptar y aprovechar los beneficios de la ciencia de datos e inteligencia artificial para resolver los desafíos actuales relacionados a corrupción en contrataciones en obras públicas del estado Peruano. La solución tecnológica a presentar contempla un nivel de innovación, aplicable, sostenible y escalable a la categoría establecida de contrataciones públicas.
Etapa 1: Extracción, transformación, carga y apertura de datos que contribuyan a resolver el desafío
El objetivo de esta etapa es que en conjunto los equipos puedan identificar las fuentes de datos relevantes a distintos retos y bajo procedimientos de extracción de información automática se puedan liberar dichos datasets de este listado preseleccionado por los organizadores. Muchos de los datos de interés están principalmente alojados en portales de consulta pública en formatos no amigables para el fin propuesto como: pdfs, resultados de búsquedas en tablas, entre otros formatos.
¿Cuáles son los patrones que denoten presuntos actos de corrupción en las instituciones públicas del Perú?
¿Sabías que el perjuicio económico al Estado peruano producto de la corrupción es de 625 millones de dólares en el año 2021? De acuerdo a la Contraloria General de la República halló que 7.740 funcionarios cometieron presuntos actos de corrupción en 2021. (https://www.sandiegouniontribune.com/en-espanol/noticias/story/2022-01-11/peru-casi-8-000-funcionarios-ligados-a-corrupcion-en-2021)
- Identificación de instituciones públicas que cuentan con datos relacionados a las compras públicas en el país.
- Identificación de Bases de Datos que contengan información útil.
- Identificación de categorías relevantes de cada base de datos.
- Obtención de las Bases de Datos.
- Consultas al Portal de Datos Abiertos.
- Descarga de Data Sets Públicos (CONOSCE, MEF, JNE).
- Web scraping (SSI, SUNAT, CONTRALORIA).
- Acceso a la Información Pública (SUNAT).
- Organizar los dataset.