-
Notifications
You must be signed in to change notification settings - Fork 0
/
informe.Rmd
172 lines (100 loc) · 4.51 KB
/
informe.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
---
title: Trabajo Práctico II
author: Constanza Guerrini
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(readr)
library(dplyr)
library(tidyverse)
```
# ^Introducción^
Los datos que se utilizarán en el presente trabajo son datos sobre las tasas de actividad por sexo desde el año 2003 al 2019 en la Ciudad Autónoma de Buenos Aires.
Fueron tomados por la Dirección General de Estadística y Censos del Ministerio de Economía y Finanzas de la Ciudad Autónoma de Buenos Aires entre los años 2003 y 2019.
## Exploración de los datos
```{r}
datos_tp <- read.csv("datos/tas_act_sexo__annio_limpio.csv")
```
### [***Nombre de las variables y Resumen estadístico de los datos:***]{.underline}
```{r}
names(datos_tp)
```
```{r}
summary(datos_tp)
```
### [***Valores Medios y Desvío Estándar***]{.underline}
```{r}
media <- datos_tp |>
group_by(sexo) |>
summarise(tasa_actividad = mean(tasa_actividad))
```
Como se puede observar, la media de la tasa de actividad general (sin distinguir por género) es de 62.44706. En el caso de la tasa de actividad femenina, se observa un promedio (media) de 55.16945 y para el genero masculino, la media de la tasa de actividad es de 71.13577.
```{r}
sd <- datos_tp |>
group_by(sexo) |>
summarise(tasa_actividad = sd(tasa_actividad))
```
Se observa un desvío estándar -en relación con esta tasa de actividad promedio- de 1.308681. Por su parte, la desviación estándar en relación con la tasa de actividad media masculina es de 1.925619.\
En cuanto a la tasa promedio femenina se observa un desvío estándar -en relación con esa tasa media- de 1.040051.
La media de la tasa de actividad masculina supera por 15.96632 a la media de la tasa de actividad femenina.
### [***Rango de los datos***]{.underline}
**General**
```{r}
max(filter(datos_tp, sexo=="TOTAL")$tasa_actividad) - min(filter(datos_tp, sexo=="TOTAL")$tasa_actividad)
```
**Varones**
```{r}
max(filter(datos_tp, sexo=="v")$tasa_actividad) - min(filter(datos_tp, sexo=="v")$tasa_actividad)
```
**Mujeres**
```{r}
max(filter(datos_tp, sexo=="m")$tasa_actividad) - min(filter(datos_tp, sexo=="m")$tasa_actividad)
```
La tasa de actividad sin distinción por sexo muestra un rango de 4.3. Mientras que el rango de la tasa de actividad masculina es de 3.3 y el de la femenina de 6.6.
No se observan anomalías que sugieran datos incorrectos.
### [***Observaciones por cada grupo***]{.underline}
```{r}
str(datos_tp)
```
El data frame "datos_tp" tiene 51 observaciones y 3 variables.
```{r}
anyNA(datos_tp)
```
No se observan valores faltantes.
# Hipótesis
1. **Durante el período 2015-2019 hubo una reducción de la tasa de actividad masculiuna.**
```{r}
periodo <- filter(datos_tp, anio>=2015 & sexo=='v')
ggplot(data = periodo, aes(x = anio , y = tasa_actividad)) +
geom_line() +
labs(x= "Año",
y= "Tasa de actividad",
title= "Tasa de actividad masculina 2015-2019",
caption = "Fuente: Ministerio de Economía y Finanzas.
Dirección General de Estadística y Censos. GCBA")
```
Como se puede observar en el gráfico, durante el período 2015-2019 se produce una baja de la tasa de actividad masculina.
2. **Existe una brecha de género en la tasa de actividad. La tasa de actividad promedio de las mujeres es menor que la tasa de actividad promedio de los varones.**
```{r}
tasa_filtrada <- filter(media, sexo != "TOTAL")
ggplot(tasa_filtrada)+
geom_col(aes(x=sexo,
y= tasa_actividad, fill=factor(tasa_actividad)))+
labs(x= "Sexo",
y= "Tasa de actividad",
title= "Tasa de actividad promedio por sexo",
caption = "Fuente: Ministerio de Economía y Finanzas. Dirección Gral. de Estadística y Censos.GCBA") +
guides(fill = guide_legend(title="Tasa de Actividad")) +
theme_minimal() +
theme(panel.border = element_rect(color = "black", fill = NA))+
theme(title = element_text(size = 10, face = "bold"))
```
**Brecha de género: Serie temporal de la tasa de actividad masculina y femenina 2015-2019**
```{r}
brecha <- datos_tp %>%
filter(anio >=2015 & sexo != "TOTAL")
ggplot(data = brecha, aes(x = anio, y = tasa_actividad))+
geom_line(aes(group = sexo, color=sexo), size=2)
```
Finalmente se puede apreciar que existe una gran brecha de género entre la tasa de actividad femenina y la tasa de actividad masculina. Esta brecha es de entre 15 y 13 puntos y fue disminuyendo con el correr de los años dentro del período analizado.