-
Notifications
You must be signed in to change notification settings - Fork 0
/
analisisRisaralda.Rmd
404 lines (314 loc) · 16.7 KB
/
analisisRisaralda.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
---
title: "Análisis Exportaciones de Café en Risaralda"
author : "Germán Grandas"
output: html_notebook
---
Usando los datos de las exportaciones de cafe desde el año 2016 al 2018 se quiere visualizar como ha cambiado la exportación de café en el departamento
```{r}
library(tidyverse)
library(lubridate)
```
##Carga de Datos
```{r}
#datos <- read_tsv(file.path('datos','CadenaProductivaCafeyExportaciones.tsv'))
datos <- read_csv(file.path('datos','CadenaProductivaActual.csv'))
```
```{r}
datos %>% summary
```
```{r}
datos <- datos %>% mutate_at(c('Anio','Mes','Cadena','Producto','Partida'),as.factor)
datos%>% summary
```
```{r}
datos %>% count(Anio)
```
##Analizando Risaralda
```{r,fig.align='center'}
datos %>% filter(grepl('isaralda',DepartamentoOrigen)) %>% ggplot(aes(Anio))+
geom_bar(aes(fill=Anio))+labs(title='Exportaciones de Café en Risaralda', y='Cantidad de Exportaciones', x='Año',fill='Año')
```
Podría decir que risaralda viene con un crecimiento constante el la exportación de café hacia el exterior, sin embargo entre los años 2006-2011 se presentó una disminución de la cantidad de exportaciones,Algo que marca importancia es que en los años 2007 y 2008 al parecer no hubo exportaciones de café en el departamento,
Será algo solo de Risaralda?
### Analizando los años 2007 y 2008 demanera general
```{r}
datos %>% filter(Anio == 2007 | Anio == 2008) %>% summary
```
No existen datos para los Años 207 y 2008
## Volviendo al análisis de risaralda
_Cantidad Exportada por Años_
```{r,fig.align='center',fig.width=9,fig.height=6}
datos %>% filter(grepl('isaralda',DepartamentoOrigen)) %>% ggplot(aes(x=Anio,y=VolúmenToneladas)) +geom_bar(stat = "identity")+
xlab("Año")+labs(title='Toneladas de Café exportadas en Risaralda')
```
En los últimos tres años ha habido una disminución en las toneladas de café exportadas, principalmente en el 2017
Cómo va en el 2018 la cantidad de exportaciones de café?
```{r,fig.align='center'}
datos %>% filter(grepl('isaralda',DepartamentoOrigen)& Anio==2018) %>%
mutate(Mes =ordered(Mes,c('Enero','Febrero',"Marzo","Abril","Mayo")))%>%ggplot(aes(x=Mes,y=VolúmenToneladas))+
geom_bar(stat = "identity")+xlab("Mes")+labs(title='Toneladas de Café exportadas en Risaralda durante el 2018')
```
Vemos Que en enero se produjo una exportación de más de 7500 toneladas de café pero que en el mes de febrero disminiyó por debajo de las 5000 toneladas, en los otros 3 meses las toneladas exportadas aumentaron, sin embargo se produjo una disminución en Mayo
Cómo se está comportanto el 2018 con respecto a los mismos meses del año anterior?
```{r}
require(gridExtra)
datos <- datos %>%mutate(Mes= ordered(Mes,c('Enero','Febrero',"Marzo","Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre","Noviembre","Diciembre")))
```
```{r,fig.align='center',fig.width=10,fig.height=5}
plot1<-datos %>% filter(grepl('isaralda',DepartamentoOrigen)& Anio==2017) %>%
filter(Mes == 'Enero' | Mes=='Febrero'|Mes=="Marzo"|Mes=="Abril"|Mes=="Mayo")%>%
ggplot(aes(x=Mes,y=VolúmenToneladas))+geom_bar(stat = "identity")+xlab("Mes")+labs(title="Cantidad Exportada para el 2017")
plot2 <- datos %>% filter(grepl('isaralda',DepartamentoOrigen)& Anio==2018) %>%
ggplot(aes(x=Mes,y=VolúmenToneladas))+geom_bar(stat = "identity")+xlab("Mes")+labs(title="Cantidad Exportada para el 2018")
grid.arrange(plot1,plot2,ncol=2)
```
Comparando con el año Anterior se encuentra que este año han disminuído las exportaciones de café del departamento.
#Cómo han cambiado los precios entre el 2017 y el 2018
```{r,fig.align='center',fig.width=14,fig.height=7}
datos%>%filter(Anio == 2017 | Anio==2018)%>%group_by(Anio,Mes)%>%
summarise(valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas))%>%ggplot(aes(x=Mes,y=valorTonelada))+geom_bar(stat = 'identity')+
facet_wrap(~Anio)+labs(title="Valor de la tonelada por mes entre el 2017 y 2018")
```
Se puede ver, que el valor de la tonelada ha venido disminiyendo desde enero del año pasado, Cómo afecta esto a la exportación?
##Como ha cambiado las cantidades exportadas según el precio de la tonelada
_2018_
```{r,fig.align='center',fig.width=12,fig.height=6}
datos %>% filter(Anio==2018) %>% group_by(Anio,Mes) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=Mes,y=totalEnviado,fill=valorTonelada))+geom_col()+
labs(title="Relación entre valorTonelada y el totalEnviado según los meses del 2018")
```
_2017_
```{r,fig.align='center',fig.width=12,fig.height=6}
datos %>% filter(Anio==2017) %>% group_by(Anio,Mes) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=Mes,y=totalEnviado,fill=valorTonelada))+geom_col()+
labs(title="Relación entre valorTonelada y el totalEnviado según los meses del 2017")
```
_2016_
```{r,fig.align='center',fig.width=12,fig.height=6}
datos %>% filter(Anio==2016) %>% group_by(Anio,Mes) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=Mes,y=totalEnviado,fill=valorTonelada))+geom_col()+
labs(title="Relación entre valorTonelada y el totalEnviado según los meses del 2016")
```
_2015_
```{r,fig.align='center',fig.width=12,fig.height=6}
datos %>% filter(Anio==2015) %>% group_by(Anio,Mes) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=Mes,y=totalEnviado,fill=valorTonelada))+geom_col()+
labs(title="Relación entre valorTonelada y el totalEnviado según los meses del 2015")
```
#Analizando por productos de café en los dos últimos años
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>%ggplot(aes(Anio))+geom_bar(aes(fill=Anio))+facet_wrap(~Partida)+
labs(title="Cantidad de Productos exportados segun el año y su tipo")
```
Mirando solo café sin tostar y tostado
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(grepl('sin tostar',Partida)|grepl('tostado',Partida))%>%
ggplot(aes(Anio))+geom_bar(aes(fill=Anio))+facet_wrap(~Partida)+
labs(title="Cantidad de productos exportados relacionados con cafés tostados y sin tostar según el año")
```
Una visión General sobre las exportaciones de cafés tostados y sin tostar
```{r}
datos %>% filter(grepl('sin tostar',Partida)|grepl('tostado',Partida))%>%
mutate(tostado = if_else(grepl('tostado',Partida),1,0)) %>% mutate_at(c('tostado'),as.factor)%>%
ggplot(aes(Anio))+geom_bar(aes(fill=tostado),position = 'fill')
```
#Analizando precios por departamento
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(Anio==2018) %>% group_by(DepartamentoOrigen) %>%
summarise(valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=DepartamentoOrigen,y=valorTonelada))+geom_bar(stat='identity')+
labs(title="Valor de la tonelada por departamento en lo corrido del 2018")
```
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(Anio==2018) %>% group_by(DepartamentoOrigen) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
ggplot(aes(x=DepartamentoOrigen,y=totalEnviado))+geom_bar(stat='identity')+
labs(title="total de toneladas enviadas por departamento en lo corrido del 2018")
```
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(Anio==2018) %>% group_by(DepartamentoOrigen) %>%
summarise(totalEnviado = sum(VolúmenToneladas),valorTonelada =sum(ValorMilesPesos)/sum(VolúmenToneladas)) %>%
filter(totalEnviado < 5000)%>%
ggplot(aes(x=DepartamentoOrigen,y=totalEnviado))+geom_bar(stat='identity')+
labs(title="total de toneladas enviadas por departamento en lo corrido del 2018")
```
## Medidas de Tendencia Central
Se analizaran las variables *VolúmenToneladas* y *ValorMilesPesos*
_Volúmen Toneladas_
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% ggplot(aes(x=Anio,y=VolúmenToneladas))+geom_boxplot()+labs(title='Distribución Toneladas por Año',x="Año")
```
_Valor Miles de Pesos_
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% ggplot(aes(x=Anio,y=ValorMilesPesos))+geom_boxplot()+labs(title='Distribución Valor Miles de Pesos por Año',x="Año")
```
Mirando la correlación entre esas dos variables
```{r}
install.packages("corrplot")
require(corrplot)
```
```{r,fig.align='center',fig.width=10,fig.height=5}
corrplot(cor(datos[,12:14]))
```
## Análisis con base en los precios del cafe
Precios OIC (precio internacional del cafe)
Precio interno base mensual
Precio externo -> Libras
Precio Interno -> Carga de cafe 125 Libras
```{r}
precioExterno <- readxl::read_excel(file.path('datos','PreciosOICcafeColombiano_Editado.xlsx'))
precioInterno <- readxl::read_excel(file.path('datos','PrecioInternoBaseMensual_Editado.xlsx'))
```
```{r}
precioExterno = precioExterno %>% mutate_at(c('Anio',"Mes"),as.factor)
precioInterno = precioInterno %>% mutate_at(c('Anio',"Mes"),as.factor)
```
```{r}
precioExterno= precioExterno %>%
mutate(Mes= ordered(Mes,c('Enero','Febrero',"Marzo","Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre","Noviembre","Diciembre")))
precioInterno = precioInterno %>%
mutate(Mes= ordered(Mes,c('Enero','Febrero',"Marzo","Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre","Noviembre","Diciembre")))
```
### Separando solo los datos a partir del año 2009
```{r}
datos = datos %>%mutate(Anio=as.numeric(as.character(Anio)))%>% filter(Anio>2008) %>%
mutate(Anio = as.factor(Anio))
levels(datos$Anio)
```
### Uniendo con los otros dos archivos
```{r}
datos <- datos %>% group_by(Anio,Mes) %>% left_join(precioExterno,by = c("Anio","Mes"))
datos <- datos %>% group_by(Anio,Mes) %>% left_join(precioInterno,by = c("Anio","Mes"))
```
##Mirando los precios según el mes
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(Anio==2018) %>% group_by(Mes) %>%
summarise(promedioExterno = mean(`Promedio ponderado`)) %>%
ggplot(aes(x=Mes,y=promedioExterno))+geom_point()+geom_line(aes(x=as.numeric(Mes)))+
labs(title="precio promedio de la libra de café en el exterior en lo corrido del 2018", y= 'Promedio Externo (USD)')
```
```{r,fig.align='center',fig.width=14,fig.height=7}
datos %>% filter(Anio==2018) %>% group_by(Mes) %>%
summarise(promedioInterno = mean(`Promedio Mensual`)) %>%
ggplot(aes(x=Mes,y=promedioInterno))+geom_point()+geom_line(aes(x=as.numeric(Mes)))+
labs(title="precio promedio de la carga de café internamente en lo corrido del 2018",y='Promedio Interno (COP)')
```
##TRM
```{r}
trm <- readxl::read_xlsx(file.path('datos','TRMHistorico.xlsx'))
```
```{r,fig.align='center',fig.width=14,fig.height=8}
trm %>%
mutate(fecha = ymd(`Fecha (dd/mm/aaaa)`),mes = month(fecha,label=T,abbr = FALSE), year = as.factor(year(fecha)))%>%
group_by(year,mes) %>% summarise(precioPromedio = mean(`Tasa de cambio representativa del mercado (TRM)`)) %>%
filter(as.numeric(as.character(year)) > 2008) %>%ggplot(aes(mes,precioPromedio,color = year, group = year))+
geom_point()+geom_line()+ labs(title='TRM del dolar desde el 2009 hasta la actualidad')
```
Array con los precios promedio mensuales del dolar, para unirlo al conjunto de datos completo
```{r}
preciosPromedioDolar <- trm %>%
mutate(Mes = as.factor(month(`Fecha (dd/mm/aaaa)`,label=T,abbr = FALSE)), Anio = as.factor(year(`Fecha (dd/mm/aaaa)`)))%>% group_by(Anio,Mes) %>% summarise(precioPromedioDolar = mean(`Tasa de cambio representativa del mercado (TRM)`)) %>%ungroup()%>%mutate(Mes = gsub("(^|[[:space:]])([[:alpha:]])", "\\1\\U\\2", Mes, perl=TRUE))
preciosPromedioDolar= preciosPromedioDolar %>%
mutate(Mes= ordered(Mes,c('Enero','Febrero',"Marzo","Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre","Noviembre","Diciembre")))
preciosPromedioDolar = preciosPromedioDolar %>%mutate(Anio=as.numeric(as.character(Anio)))%>% filter(Anio>2008) %>%
mutate(Anio = as.factor(Anio))
```
```{r}
datos <- datos %>% group_by(Anio,Mes) %>% left_join(preciosPromedioDolar,by = c("Anio","Mes"))
```
## Guardando el archivo "final"
```{r}
write_rds(datos,file.path('datos','datosFinales.rds'))
```
# PARTE 2
Carga inicial de los datos
```{r}
datos <- read_rds(file.path('datos','datosFinales.rds'))
```
Establecer un marco de referencia común entre los diversos precios
Precios OIC -> centavos de dolar por libra ( 100 centavos = 1 dolar)
$valorXlibraDolares =\frac{precioXlibra}{100}$
Precios Internos -> Pesos por carga de 125 kg (Precio / 125 -> valor de cada Kilo /2 ->valor de cada libra)
$ValorXlibra = \frac{PrecioXcarga}{250}$
```{r}
names(datos)
datos = datos %>% select(-`Precio del indicador compuesto OIC`,-`Nueva York`,-Alemania)
```
## Análisis libra interna-libra externa
```{r}
datos <- datos %>%
mutate(valorXlibraExt_USD = round(`Promedio ponderado (USD)`/100,4),
valorXlibraInt_COP= round(`Promedio Mensual (COP)`/250,4))
```
```{r}
datos <- datos %>%
mutate(valorXlibraInt_USD = round(valorXlibraInt_COP / precioPromedioDolar,4))
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%filter(Anio==2017)%>%group_by(Mes) %>%
mutate(exporta = n(), difPrecios = (valorXlibraInt_USD-valorXlibraExt_USD)) %>%
ggplot(aes(Mes,difPrecios, color=exporta)) + geom_point(size = 6)+
labs(title="Relación entre la diferencia de precios y las cantidades exportadas por mes")
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%group_by(Anio,Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%
ggplot(aes(Mes,difPrecios,color=exporta)) + geom_point(size = 4)+facet_wrap(~Anio)+
labs(title="Relación entre la diferencia de precios y las cantidades exportadas por Año")
```
##Analisis libra externa-libra interna
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%filter(Anio==2017)%>%group_by(Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraExt_USD-valorXlibraInt_USD) %>%
ggplot(aes(Mes,difPrecios, color=exporta)) + geom_point(size = 6)+
labs(title="Relación entre la diferencia de precios y las cantidades exportadas por mes")
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%group_by(Anio,Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraExt_USD-valorXlibraInt_USD) %>%
ggplot(aes(Mes,difPrecios,color=exporta)) + geom_point(size = 4)+facet_wrap(~Anio)+
labs(title="Relación entre la diferencia de precios y las cantidades exportadas por Año")
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%filter(Anio==2017)%>%group_by(Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraExt_USD-valorXlibraInt_USD) %>%
ggplot(aes(difPrecios,exporta,color=Mes)) + geom_jitter(size = 3)+
labs(title="Relación entre la diferencia de precios y las cantidades exportadas para el 2017")
```
## análisis por precios
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%filter(Anio==2017)%>%group_by(Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%ungroup()%>%
ggplot(aes(x=valorXlibraInt_USD,y=exporta)) + geom_point(size=6)+
labs(title="Relación entre el precio interno y las cantidades exportadas por mes",x="valorXlibraInt_USD")
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%group_by(Anio,Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%ungroup()%>%
ggplot(aes(x=valorXlibraInt_USD,y=exporta)) + geom_jitter(size=4)+facet_wrap(~Anio)+
labs(title="Relación entre el precio interno y las cantidades exportadas por mes",x="valorXlibraInt_USD")
```
###Precios libra externa
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%group_by(Anio,Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%ungroup()%>%
ggplot(aes(x=valorXlibraExt_USD,y=exporta)) + geom_jitter(size=4)+facet_wrap(~Anio)+
labs(title="Relación entre el precio Externo y las cantidades exportadas por mes",x="valorXlibraInt_USD")
```
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%group_by(Anio,Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%ungroup()%>%
ggplot(aes(x=valorXlibraInt_USD,y=valorXlibraExt_USD,color=exporta)) + geom_jitter(size=4)+facet_wrap(~Anio)+
labs(title="precio interno vs Precio Externo",x="valorXlibraInt_USD")
```
###Analizando el 2017
```{r,fig.align='center',fig.width=12,fig.height=8}
datos %>%filter(Anio==2017) %>%group_by(Mes) %>%
mutate(exporta = n(), difPrecios = valorXlibraInt_USD-valorXlibraExt_USD) %>%ungroup()%>%
ggplot(aes(x=valorXlibraInt_USD,y=valorXlibraExt_USD,color=exporta)) + geom_jitter(size=4)+facet_wrap(~Anio)+
labs(title="precio interno vs Precio Externo",x="valorXlibraInt_USD")
```