Skip to content

electorArg/PolAr_Data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

{polAr}Data - POLítica ARgentina usando R

Repositorio de datos de polAr

Datos electorales

  • El repositrio contiene resultados electorales nacionales de Argentina desde 2007 (las elecciones de 2003, 2005 y 2019 están siendo procesadas) para las categorías Senador Nacional, Diputado Nacional y Presidente.

  • Los archivos en crudo (raw) estan a nivel mesa (urna). Las bases de datos incluyen identifcadores de varios niveles superiores en la organización electoral, como departamento (coddepto) y provincias codprov.

geo Datos

  • archivos con geomterías (.shp) de provincias y departamentos.

  • grillas como si fueran mapas para usar gon geofacet de Argentina y las 24 provincias.

Procesamiento de datos

Fuentes de datos

La fuente original de datos para resultados de elecciones nacionales (2003 - 2017) provienen del Atlas Electoral de Andy Tow. Se puede acceder a ellas en las sección de descargas de su sitio web. Para acceder es necesario autenticar la consulta a través de una cuenta de Twitter.

Los datos de las elecciones de 2019 tienen una estructura diferente de las de años anteriores (primera vez que cambió proveedor de escrutinio provisorio desde el inicio de nuestra muestra en 2003). Los resultados fueron reconstruidos de unos paquetes especificos desarrollados por @pmoracho para cada turno: paso y generales.


Para el procesamiento de datos de este repositorio seguimos los siguientes pasos:
INDRA - Andy Tow

(1) Descargamos los archivos para cada una de las elecciones del atlas.

(2) Pasamos del formato original (mdb) de Microsoft Acces a sql para trabajar con R. Para hacerlo seguimos los siguientes pasos:

  • Descargamos este archivo mdb2sqlite.sh.
  • Renombramos el archivo (uno por uno) de la base de datos que se deseabamos transformar (con extensión mdb) de esta manera: migration-export.mdb
  • Corrimos el siguiente comando: ./mdb2sqlite.sh migration-export.mdb
  • Esperar... y esperar un rato más... y un poco más...
  • Al final del proceso, dentro de la carepta sqlite encontrabamos un archivo nuevo (db.sqlite3).

(3) Con los nuevos arhcivos sql desde RStudiocorrimos un programa para trabajar con lengauje SQL en las múltiples tablas del archivo original (que incluye datos de todos los distritos de Argentina para cada una de las elecciones) y generar un archivo de texto separado por comas (.csv) para los datos de interes.

Es importante primero instalar y configurar los drivers de las bases de datos para poder generar la conexión entre RStudioy las mismas y poder hacer las consultas (en esta caso de sql).

  • Instructivo general del paquete db de RStudio, los drivers necesarios y datos específicos para el caso particular de conexiones de sqlite.
Documentación del proceso (en revisión)

Vale remarcar que cada una de las categorías electorales (diputados, senaodres y presidente) tiene una dinámica propia. La única de ellas que comparte la misma oferta electoral en todos los distritos es naturalmente la categoría 'presidente'. En tanto, todas las provincias eligen 'diputados' cada dos años, pero solo ocho provincias eligen 'senadores' cada dos años. Esto es, los representantes del Senado de cada provincia se renueva cada 6 años (o tres procesos electorales).

Partiendo de ese escenario:

  • Generamos notebooks Rmd que incluye las consultas SQL de P.A.S.O. y Generales para las distintas categorías electorales presentes en cada ciclo electoral.

Los notebook incluyen:

(1) chunk de R para establacer la conexión con las bases de datos de SQLite con resultados electorales

  • Cargamos las librerias
  • Establecimos la ruta donde se encuentran los archivos
  • Generamos la conexión con las bases de datos

(2) SQL chunk para consultar código y nombre de departamentos de cada provincia

  • Guardados como data.frame en el entorno (enviromentde RStudio): *Deptos_Provincias*

  • La columna depNombre incluye el nombre de las provinicas, cuyo depCodigoDepartamento == 999, y nos permite ver rápidamente el código de cada provincia.

(3) SQL chunk para obtener los nombres de partidos (y sus codigos) para una eleccion particular

  • En las opciones de sql la connection lleva el nombre correspondiente a la base de datos de la elección.

  • Por ejemplo, el código de la provincia - vot_pro_CodigoProvincia- para la provincia de Tucumán es el 23(del chunk previo).

  • Si quiero guardar la consulta como data.frame de R tengo que agregar opción output.var = "NombreDataFrame" en el chunk de sql.

  • Luego podemos exportar a csv con el siguiente comando desde la consola: readr::write_csv(NombreDataFrame, "NombreDataFrame.csv")

(4) SQL chunk con la consulta final de los resultados electorales

  • Obtuvimos los valores absolutos de listas, blancos, electores, y validos.

  • Tambien extrajimos los códigos de identificación de las observaciones (mesa, circuito, departamento y provincia) para poder agrupar a distintos niveles. Cada fila corresponde a los resultados de una mesa electoral de una elección determinada.

  • Guardamos con output.var como dataframe. Repetimos proceso de (3)para exportar como csv.

Releases

No releases published

Packages

No packages published

Languages