-
Notifications
You must be signed in to change notification settings - Fork 0
/
AnalisisProduccion.rmd
129 lines (96 loc) · 2.68 KB
/
AnalisisProduccion.rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
---
title: "Análisis producción café 2009-2018"
output: html_notebook
---
```{r}
library(tidyverse)
library(lubridate)
```
se cargan los datos
```{r}
datosAnual <- readxl::read_excel(file.path('datos','Produccion_valor_anualModf.xlsx'))
```
#Datos Valor Anual Producción
##EDA
```{r}
datosAnual <- datosAnual %>%
mutate(yearC = as.factor(`AÑOS CALENDARIO`), yearsC = as.factor(`AÑOS CAFETEROS`)) %>% mutate(vCosecha = `Valor de la cosecha`, vCosechaCaf = `Valor de la cosecha Cafeteros` )%>%select(yearC,vCosecha, yearsC,vCosechaCaf)
```
```{r}
datosAnual %>% ggplot(aes(x=yearC,y=vCosecha)) +geom_point()+labs(title='Valor de la producción Anual')+geom_line(aes(x=as.numeric(yearsC)))
```
```{r}
datosAnual %>% ggplot(aes(x=yearsC,y=vCosechaCaf))+geom_point()+
geom_line(aes(x=as.numeric(yearsC)))+
labs(title='Valor de la producción Anual AñosCafeteros')+
theme(axis.text.x = element_text(angle = 90, hjust = 1))
```
```{r}
write_rds(datosAnual,file.path('datos','datosAnualesProd.rds'))
```
#Datos Volumen Mensual
```{r}
datosvol <- readxl::read_excel(file.path('datos','Produccion_volumen_mensualCompleto.xlsx'))
```
```{r}
datosvol %>% summary
```
```{r}
datosvol <- datosvol %>% mutate( year = year(Mes) , mes = as.factor(month(Mes,label=T,abbr = FALSE)), prod = `Producción`) %>% select(year,mes,prod)
```
###EDA
```{r}
datosvol %>% group_by(year) %>% summarise(prodT = sum(prod)) %>%
ggplot(aes(x=year,y=prodT))+geom_point()+
geom_line(aes(x=as.numeric(year)))+
labs(title='Producción Anual Total')
```
```{r}
datosvol %>% group_by(year) %>% summarise(prodP = mean(prod)) %>%
ggplot(aes(x=year,y=prodP))+geom_point()+
geom_line(aes(x=as.numeric(year)))+
labs(title='Producción Anual Promedio')
```
#Analizando Series de tiempo
```{r}
#install.packages('xts')
library(astsa)
library(xts)
```
```{r}
#Datos modificados
datosvol <- read_rds(file.path('datos','datosVolMensual.rds'))
#Datos sin modificar
datosvol2 <- readxl::read_excel(file.path('datos','Produccion_volumen_mensualCompleto.xlsx'))
#Datos convertidos a TimeSeries
datos <- xts(x=datosvol2$Producción, order.by = datosvol2$Mes)
```
##EDA
```{r}
datos %>% plot(., main='Producción mensual de café desde 1956 hasta 2018')
```
```{r}
plot(diff(log(datos)))
```
```{r}
plot(acf2(diff(log(datos))))
```
```{r}
datosT <- diff(log(datos))
```
```{r}
model <- sarima(datos,p=1,d=0,q=0)
```
```{r}
model$ttable
model$AIC
model$BIC
```
```{r}
model <- sarima(datosT,p=0,d=1,q=1)
```
```{r}
model$ttable
model$AIC
model$BIC
```