https://doi.org/10.29166/ingenio.v7i1.4546
pISSN 2588-0829
© 2021 Universidad Central del Ecuador
eISSN 2697-3243
CC BY-NC 4.0 Licencia Creative Commons Reconocimiento-NoComercial 4.0 Internacional fing.revista.ingenio@uce.edu.ec
REVISTA INGENIO
FACULTAD DE INgENIERíA y CIENCIAS ApLICADAS INGENIO
UNIVERSIDAD CENTRAL DEL ECUADOR 2024, vol 7(1), enero-junio, pp. 4-11
Violencia en Ecuador: Análisis de Homicidios Mediante Series de Tiempo
Violence in Ecuador: Analysis of Homicides Through Time Series
Atal Kumar Vivas Paspuel, 1 | ID Universidad de las Fuerzas Armadas ESPE, Santo Domingo (Ecuador)
David Alfredo Vivas Paspuel, 2 | ID Universidad Central del Ecuador, Quito (Ecuador)
HISTORIA DEL ARTÍCULO
Recepción: 8/5/2023
Recepción tras revisión:
29/9/2023 Aprobación:
30/10/2023 Publicación:
15/01/2023
PALABRAS CLAVE
Pronósticos, series de tiempo,
modelos, homicidios.
ARTICLE HISTORY
Received: 8/5/2023
Received after revision:
29/9/2023 Approved: 30/10/2023
Accepted: 15/1/2024
KEY WORDS
Forecasts, time series, models,
homicides.
RESUMEN
La violencia en Ecuador no tiene precedentes, los índices de homicidios, femicidios, robos, atentados y
otros tipos de crímenes han aumentado de forma alarmante en este país. Todos los días se reportan
nuevos eventos que son noticia y alarman a la comunidad. Las instituciones gubernamentales junto con
la organización policial y las fuerzas militares realizan acciones para mitigar la ola de violencia sin
alcanzar resultados eficientes. Este trabajo analiza la cantidad de homicidios a nivel nacional como una
serie temporal con el fin de conocer el comportamiento de esta variable en los últimos años. Aplicando
modelos de suavizado, así como el modelo ARIMA y Red Neuronal se busca el modelo más eficiente
que minimice el error de predicción. Entre los modelos de suavizado se encontró al modelo de Holt
como el más eficiente, sin embargo, pero al comparar todos los modelos aplicados, se encontró que el
modelo de Red Neuronal es el más eficiente con el cual se pueden obtener buenos pronósticos.
ABSTRACT
Violence in Ecuador is unprecedented, the rates of homicides, femicides, robberies, attacks and other
types of crimes have increased alarmingly in this country. Every day new events are reported that are
news and alarm the community. Government institutions, together with the police organization and the
military forces, carry out actions to mitigate the wave of violence without achieving efficient results. This
paper analyzes the number of homicides nationwide as a time series to know the behavior of this variable
in recent years. Applying smoothing models, as well as the ARIMA and Neural Network models, the
most efficient model is sought. that minimizes the prediction error. Among the smoothing models, the
Holt model was found to be the most efficient, however, but when comparing all the applied models, it
was found that the Neural Network model is the most efficient with which good forecasts can be obtained
1.
INTRODUCCIÓN
El año 2022 ha sido considerado uno de los más
violentos de la historia de Ecuador. Según la policía
nacional, se registraron al menos 4.539 muertes violentas
que se dieron en diferentes circunstancias como
sicariatos, homicidios, femicidios, robos con asesinato o
actos criminales con explosivos. En términos de la tasa
de muertes delincuenciales, este dato equivale a 25,5
muertes por cada 100.000 habitantes en 2022. Haciendo
una comparación respecto al año anterior, se observa un
crecimiento abrupto en esta tasa ya que para el 2021 se
registraron 2.048 crímenes, lo que significan 13,7
muertes por cada 100.000 habitantes. Las autoridades de
seguridad están de acuerdo en que es la tasa más alta de
la historia desde que se tienen registros sobre muertes
delincuenciales [1].
Las razones para la escalada de violencia en el país son
de variado orden. Se conoce que el crimen organizado
transnacional crece, se perfecciona en su logística y
comunicación y se despliega de forma acelerada. Se
conoce la asociación que existe entre estas organizaciones
y el estado desde hace varios años. La tecnificación y
globalización del comercio a nivel internacional ha hecho
que el crimen tenga más facilidades para los flujos ilícitos
a través de las fronteras (Crimen organizado cadenas de
valor). La disputa entre organizaciones criminales es otra
razón para el incremento de crímenes. Las bandas se
enfrentan por mantener el mando en las cárceles del
Ecuador y por lo tanto, los principales centros de
privación de libertad del país han sufrido a la par el
aumento en la violencia interna, llevando a las autoridades
a soportar una crisis de críticas y demandas [2].
Bajo estas circunstancias, se vuelve necesario conocer el
problema a través de la información recabada en los
eventos violentos. Los recuentos de estos eventos por mes
pueden ser útiles para realizar predicciones por medio de
Vivas K. y Vivas D.
5
series de tiempo. Los pronósticos en series de tiempo por
medio de un modelo adecuado proporcionan un estimado
cuantitativo en un marco de probabilidad para eventos
futuros. Es importante incorporar este tipo de pronósticos
para el recuento de crímenes ya que las autoridades
requieren información que les permita organizar hacia el
futuro la logística que implica contener los hechos
violentos [3]. Este trabajo realiza un análisis de la serie
de tiempo construida con los recuentos de homicidios y
femicidios desde enero 2014 hasta enero 2022. Esta serie
de tiempo es analizada mediante varios modelos de
pronósticos: modelo de medias móviles, modelo
exponencial simple, modelo de Holt, modelo de Holt
Winters, ARIMA y Red Neuronal. Estos modelos
cuentan con su formulación y sus parámetros asociados.
El paquete computacional Statgraphics se utiliza para los
modelos de medias móviles, exponencial simple, modelo
de Holt y modelo de Holt Winters (llamados también
modelos de suavizado), mientras que los modelos
ARIMA (Autorregresive Integrated Moving Average) y
Red Neuronal se aplican mediante el software R. El error
cuadrático medio (RMSE), el Error Absoluto Medio
(MAE) y el Error Absoluto Porcentual Medio (MAPE) se
usarán como estadísticos de comparación para rescatar el
mejor modelo.
2.
TODO
Una serie de tiempo es una sucesión de datos:
, sobre una variable particular y que son
tomados a través del tiempo. Es decir, es una secuencia
ordenada de observaciones sobre alguna variable
de interés. Las series más usuales son las univariantes, es
decir, que miden tan solo una variable a través del
tiempo, sin embargo, los análisis pueden extenderse a
más variables. Los modelos utilizados para el manejo de
las series son variados, en este trabajo se utilizan los
métodos de suavizado, que permiten controlar el ruido o
las fluctuaciones aleatorias que dificultan la
interpretación de la serie o modelos como el ARIMA y el
modelo de Red Neuronal.
Suponiendo que la serie de datos se puede descomponer
en: tendencia, ciclo, estacionalidad e irregularidad, se
afirma que la serie es el resultado de la suma de los
componentes teóricos:
(1)
La tendencia de una serie , es aquella parte de la serie
que describe los cambios de la variable a largo plazo, es
decir, representa el crecimiento o caída de la serie a
través de un período amplio en el tiempo. La parte
estacional , define un patrón de cambio que se
encuentra dentro el periodo de un año y para su detección
del patrón estacional, suelen usarse métodos
multiplicativos o aditivos. La parte cíclica , llamado
también efecto cíclico, se determina como una
fluctuación que se relaciona con la tendencia y que tiende
a repetirse durante periodos mayores a un año. Suele ser
difícil establecer modelos cíclicos debido a la
inestabilidad que estos presentan. La parte irregular de la
serie de tiempo se determina como un factor residual, es el
resto de la serie luego de sumar las tres primeras
componentes, por lo tanto, puede definirse también como
la parte aleatoria.
La media de la serie se define como el valor constante en
el tiempo alrededor del cual evoluciona la serie. La
varianza es el valor que mide la dispersión o variabilidad
de la serie alrededor de su media. La autocorrelación se
define como la medida de la relación existente entre dos
observaciones consecutivas de la serie, es decir separadas
por un periodo temporal que también se denomina retardo.
Para el caso de los modelos ARIMA, suele suponerse que
la serie cumple la hipótesis de estacionariedad. Esta
suposición implica consideraciones de tipo estocástico
sobre la media y varianza de la serie.
2.1 Modelo de medias móviles
Una de las formas de suavizar una serie es por medio del
método de las medias móviles que se basa en el cálculo de
una media para valores vecinos de la serie de forma
consecutiva [4]. Por lo tanto, podemos tomar una cantidad
de los datos de la serie y promediarlos y así construir una
nueva serie suavizada correspondiente. En nuestro caso
utilizamos una media móvil para 5 puntos, es decir, la
primera media, es el promedio entre y , la
segunda media será el promedio entre y , y
así sucesivamente. Se puede ponderar la información
aplicando pesos a cada observación, el promedio sería:


 󰇛󰇜
donde  , entonces  es la proporción asignada
a . Por lo tanto, 
 .
2.2 Modelo exponencial simple
Cuando se requiere predecir valores a futuro para una
serie, podemos pensar en utilizar muchos valores
rezagados o simplemente tomar en cuenta el ultimo o los
últimos valores recabados. El método de suavizado es una
solución intermedia entre estos extremos, es decir, realiza
un pronóstico basado en una media ponderada de los
valores actuales y de los pasados [5]. El cálculo de esta
media dará más peso a la última observación, menos peso
al valor inmediatamente anterior, y así sucesivamente
hacia atrás. Representando esto en una ecuación tenemos:
󰇛󰇜󰇛󰇜 󰇛󰇜 (3)
En esta ecuación, es un valor entre 0 y 1.
Violencia en Ecuador: Análisis de Homicidios Mediante Series de Tiempo
6
2.3 Modelo de Holt
Este modelo se considera como un mejoramiento al
modelo exponencial simple al agregar un parámetro al
modelo, por lo que se lo puede definir como modelo
exponencial doble. Por lo tanto, los dos parámetros ahora
son y . El modelo queda como sigue
 󰇛󰇜󰇛 󰇜󰇟󰇛
󰇜󰇛󰇜󰇠 (4)
En donde, y son parámetros que están entre 0 y 1. La
constante es relativa al modelo de suavizado
exponencial simple. La constante es la constante de
suavizado de la tendencia de la serie.
2.4 Modelo de Holt-Winters
Este modelo, a diferencia de los anteriores, añade una
componente de estacionalidad que puedan presentar los
datos de la serie. Por lo tanto, este modelo presentará y
dependerá de 3 parámetros [5]:  y en sus
ecuaciones. Siendo  la variable alisada al tiempo
, la podremos calcular mediante
 󰇛󰇜, en donde
 󰇛 󰇜󰇛 󰇜 (5)
󰇛󰇜󰇛󰇜 (6)
󰇛 󰇜 (7)
2.5 Modelos ARIMA
El modelo ARIMA se aplica a series de tipo
estacionarias. Una serie estacionaria es aquella cuyos
valores y propiedades no dependen del tiempo en el que
se encuentra la serie. Por ejemplo, si una serie posee
tendencias o estacionalidad, no es estacionaria, pero una
serie de ruido blanco es estacionaria ya que en cualquier
tiempo debería verse igual. Para obtener una serie
estacionaria a partir de series no estacionarias, suele
realizarse una diferenciación entre observaciones
consecutivas [6]. Un modelo autorregresivo es aquel que
usa observaciones pasadas combinadas linealmente para
realizar predicciones a futuro. La autorregresión significa
que el modelo se basa en la regresión de la variable con
ella misma.
Al combinar un modelo autorregresivo con uno de
medias móviles, se genera el modelo ARIMA. Es decir,
si combinamos la diferenciación con la autorregresión y
un modelo de media móvil, obtenemos un modelo
ARIMA no estacional. ARIMA es un acrónimo de Media
Móvil Integrada Autorregresiva. Se dice que tenemos un
modelo ARIMA(p,d,q) donde:
p, es el orden autorregresivo del modelo.
d, grado de la diferenciación involucrada en el modelo.
q, orden de la media móvil del modelo.
2.6 Modelo de Redes Neuronales
Estas redes constituyen métodos de pronóstico basadas en
métodos matemáticos que copian la actividad del cerebro.
Pueden modelar relaciones no lineales y relaciones
complejas entre la variable de respuesta y sus predictores
[5]. La red neuronal es una red de "neuronas" que se
organizan mediante capas. Las entradas son los
predictores y las salidas son los pronósticos. Todo esto
está organizado mediante capaz inferiores, superiores e
intermedias [7].
Figura 1
Estructura básica de una red neuronal.
Para series de tiempo, los valores retrasados de la serie
pueden servir como entradas para una red neuronal, a esto
lo llamamos autorregresión de red neuronal o modelo
NNAR (Neural Network Autoregression). Usamos la
notación NNAR(p,k) para indicar que hay p entradas y k
nodos retrasados en la capa oculta. Por ejemplo, un
modelo NNAR(9,5) usa las ultimas nueve observaciones
utilizadas como entradas para pronosticar la salida y con
cinco neuronas en la capa oculta. El paquete Forecast de
R implementa el modelo de redes neuronales de
alimentación hacia adelante que contiene una sola capa
oculta y las entradas son los lags o retrasos de la serie.
Estos insumos le permiten al modelo realizar pronósticos
para las series temporales univariadas. En R, la red
implementada tiene una sola capa oculta y la cantidad de
entradas depende de la cantidad de rezagos que tienen los
datos [8]. En R usamos la función nnetar() para aplicar el
modelo.
El modelo matemático puede ser escrito como
󰇛󰇜, donde  󰇛󰇜 es el
vector que contiene los valores rezagados de la serie en
análisis y representa la red neuronal. Se asume que el
error de la serie 󰇝󰇞 es homocedástico y normalmente
distribuido. Se puede simular muestras futuras de este
modelo de forma iterativa, generando aleatoriamente un
valor para , por medio de la distribución normal o de
una nueva muestra de los valores históricos. Entonces, si

es una muestra de la distribución de los errores al
Vivas K. y Vivas D.
7
tiempo , entonces 
󰇛󰇜
es una
posible muestra de la distribución de predicciones para
. Así que es posible simular iterativamente las
predicciones requeridas. Al simular repetidamente
muestras, se puede conocer la distribución de las
predicciones en función de la red neuronal.
3.
RESULTADOS Y DISCUSIÓN
Se muestra en primer lugar la serie de observaciones
para la variable Homicidios Intencionales (Absolutos)
tomados del Instituto Nacional de Estadísticas y Censos
(INEC) desde enero 2014 hasta mayo 2022 con
frecuencia mensual en Ecuador [9]. El número de
observaciones es 101 y el periodo es mensual.
Tabla 1
Datos de homicidios absolutos a nivel nacional en Ecuador.
Mes
2014
2015
2016
2017
2018
2019
2020
2021
2022
Enero
151
98
99
95
73
83
113
122
315
Febrero
101
82
73
90
86
87
116
226
311
Marzo
129
106
78
93
89
83
80
173
344
Abril
120
85
77
86
99
117
88
176
365
Mayo
107
95
89
90
98
102
96
172
424
Junio
115
100
84
80
76
101
115
171
Julio
82
75
87
75
71
90
94
198
Agosto
114
78
72
68
76
89
122
203
Septiembre
90
82
82
71
89
95
105
325
Octubre
82
89
56
69
76
115
138
225
Noviembre
106
82
89
65
82
111
148
282
Diciembre
113
78
73
88
80
114
157
223
Una primera visualización de la serie se muestra en la
Fig. 2, la cual evidencia el crecimiento de muertes que ha
sufrido el país por causas del crimen. Podemos ver una
leve caída desde el 2014 hasta el 2020 y desde este punto
se dispara el número de casos hasta el 2022. Se espera,
según la tendencia, que la variable siga creciendo en los
siguientes periodos de tiempo.
Figura 2
Serie de tiempo para homicidios absolutos
La descomposición de la serie en sus componentes de
tendencia, estacional, cíclica e irregular la podemos ver
como modelo aditivo en la Fig. 3. Podemos ver que no se
trata de una serie estacionaria, al no tener varianza
constante y tener una tendencia bien marcada.
Figura 3
Descomposición aditiva para la serie de datos.
Para mostrar los resultados de los modelos de medias
móviles, exponencial simple, Holt y Holt Winters, se
utilizó el software Statgraphics, un software estadístico
estándar, cuya virtud es mostrar los resultados de forma
amigable incluso para investigadores que no tienen
conocimientos estadísticos. Una ventaja es la omisión del
uso de programación para la obtención de resultados
personalizados dirigido a personas que no tengan grandes
conocimientos de estadística, además de no utilizar
programación y, por tanto, simplificar el trabajo.
Para esto, dispone del intérprete StatAdvisor que permite
interpretar estadísticamente los resultados de los modelos
Violencia en Ecuador: Análisis de Homicidios Mediante Series de Tiempo
8
utilizados en los análisis, lo cual ayuda si no se tienen
conocimientos suficientes de estadística.
Los resultados para los modelos de medias móviles,
exponencial, Holt y Holt Winters pueden verse en la Fig. 4.
Para cada modelo, la línea roja marca las predicciones
calculadas, al final se realizan varias predicciones. Para los
modelos de medias móviles y exponencial simple se puede
observar que las predicciones a futuro se comportan como
una recta horizontal constantes, es decir, se tienen las
mismas predicciones. Esto se debe al hecho de que estos
dos modelos no toman en cuenta características como la
tendencia de los datos. Los modelos de Holt y Holt
Winters si toman en cuenta estas características de la serie,
esto implica que su modelo depende de una mayor
cantidad de parámetros y su ventaja es que las predicciones
mejoran, reduciendo el error de predicción. Los parámetros
y para estos modelos son optimizados por el paquete
Statgraphics.
Figura 4
Pronósticos para los modelos de media móvil, exponencial, Holt y Holt
Winters
La Tabla 2 muestra los errores de predicción para cada
uno de los modelos de suavizado. Los errores
considerados son: RMSE, MAE y MAPE. Podemos ver
que, para todos los estadísticos de error, el modelo Holt
obtiene los valores más bajos. por lo que puede ser
considerado el más eficiente en este grupo. Los
parámetros:  y fueron optimizados mediante
Statgraphics, de modo que se minimicen los errores.
Tabla 2
Comparación de errores para los modelos de suavizado
RMSE
MAE
MAPE
Parámetros
28,7255
17,5535
13,2376
términos = 5
25,3336
15,9956
12,3626
alpha = 0,563
22,5778
15,0606
12,3494
alpha = 0,211, beta = 0,275
22,9257
15,1591
12,4563
alpha = 0,214, beta = 0,286, gamma = 0,013
Para los modelos ARIMA y Redes Neuronales hemos
realizado un análisis separado dado que sus técnicas son
diferentes a los primeros modelos y relativamente son
modelos más actuales. En la Tabla 3 podemos ver la
comparación de errores para estos modelos, el modelo de
Redes Neuronales presenta los valores más bajos con
respecto al modelo ARIMA y al resto de modelos, por lo
que puede ser considerado el más eficiente. Para estos dos
modelos hemos utilizado el software R. Para el caso de
ARIMA, R optimiza los parámetros p, d y q. Para el caso
de Red Neuronal, R trabaja internamente en el modelo. En
nuestro caso, p=100 y k=1, es decir que la red será
alimentada mediante 100 rezagos y por defecto, R trabaja
con una sola capa oculta.
Tabla 3
Comparación de errores para los modelos ARIMA y Red Neuronal
Modelo
RMSE
MAE
MAPE
Parámetros
ARIMA
20,529
13,569
11,383
p = 2, d = 2, q = 3.
Red Neuronal
18,668
12,935
11,090
p=100, k=1
El análisis de los residuos es importante para conocer el
comportamiento de la serie de tiempo una vez que se
aplica un modelo. La Fig. 5 muestra el comportamiento
de los residuos para la serie de tiempo, sus
autocorrelaciones y la distribución de estos.
Podemos ver que las autocorrelaciones se encuentran
entre los límites permitidos y que la distribución parece
tener media cero. Esto lo podremos corroborar en las
pruebas de hipótesis correspondientes.
Vivas K. y Vivas D.
9
Figura 5
Residuales para el modelo de Redes Neuronales. Modelo
NNAR(2,1,2).
La indicación NNAR(2,1,2) es una especificación de
hiperparámetros para el modelo NNAR. Los números
entre paréntesis representan los valores de los
hiperparámetros del modelo: "2" se refiere al número
de capas ocultas en la red neuronal, "1" se refiere al
número de neuronas en la capa oculta. "2" se refiere al
retraso máximo en el modelo autorregresivo.
Ruido Blanco
Para probar la existencia de ruido blanco lo hacemos
por medio de la prueba de Ljung‐Box cuyas hipótesis
dicen lo siguiente:
Ho: Hipótesis Nula (existe ruido blanco)
H1: Hipótesis alternativa (no existe ruido blanco)
Por medio del software R se obtuvo un p-value < 2.2e-
16, por lo tanto, podemos concluir que se rechaza H0,
es decir que los residuos no se comportan como ruido
blanco.
Media nula.
Para verificar si los residuos tienen media nula,
podemos realizar la prueba de hipótesis sobre la media:
Las hipótesis serían:
H0: (Media Nula)
H1: (Media no Nula)
Mediante el software R se obtiene un p-value = 0.9904,
entonces, no se rechaza la hipótesis nula, por lo tanto,
la media de los residuos es estadísticamente cero.
Varianza constante
Para determinar si existe varianza constante hemos
realizado la prueba de McLeod-Li que consiste en una
prueba de heterocedasticidad condicional autorregresiva
para una serie de tiempo. Las hipótesis son
H0: No existe heteroscedasticidad condicional
autorregresiva (ARCH) entre los rezagos considerados.
H1: Existe heteroscedasticidad condicional
autorregresiva (ARCH) entre los rezagos considerados.
Dado que se trata de una prueba múltiple, el resultado es
una gráfica que muestra los p-values en una sola grafica.
Por tanto, habría que observar cuantos de estos valores
están por debajo de la línea de color rojo y ver si estos
son suficientes para rechazar la hipótesis nula. En la
Fig.6 (Anexo Fig.6) podemos ver que la mayoría de las
marcas están por encima de la línea de color rojo por lo
que no podemos rechazar H0, es decir que existe
heteroscedasticidad condicional autorregresiva (ARCH)
entre los rezagos considerados.
Los residuos siguen una distribución normal
Se realiza la prueba de Shapiro - Wilk a los residuos
para conocer si se distribuyen normalmente, las hipótesis
son:
H0: La variable presenta una distribución normal
H1: La variable presenta una distribución no normal
Mediante el software R, se obtiene que p-value = 2.601e-
05, con lo cual los residuos no siguen una distribución
normal.
4.
CONCLUSIONES
Se han aplicado los modelos de suavizado para el
tratamiento de la serie de tiempo: medias móviles,
exponencial simple, Holt y Holt Winters. Estos modelos
permiten describir en forma general el comportamiento
de la serie temporal pero no siempre las predicciones son
las más eficientes. Para estos modelos, los errores más
bajos fueron obtenidos por el modelo de Holt, RMSE =
22,5778, MAE = 15,0606 y MAPE = 12,3494. Estos
modelos se aplican Cuando las series son muy
irregulares, suele aplicarse modelos deterministas que
suavizan la forma de la serie y nos permite realizar una
mejor interpretación visual de la misma. Sin embargo,
estos modelos no son tan eficientes al realizar pronósticos
por lo que, dependiendo de las aplicaciones, podrían
aplicarse modelos alternativos. Los modelos
deterministas que se aplican son: Medias móviles con 5
elementos, Exponencial simple, Holt y Holt Winters.
Para analizar series de tiempo es importante analizar los
residuos del modelo ya que nos permite conocer la
eficiencia y en que magnitud se ha capturado las
Violencia en Ecuador: Análisis de Homicidios Mediante Series de Tiempo
10
características de los datos de la serie. Para que el ajuste
del modelo sea eficiente, los residuos deberían: a)
Presentar una baja autocorrelación o autocorrelación
parcial ya que la presencia de correlación, indica que el
modelo ha perdido alguna información de los datos.
Hemos usado una prueba Ljung-Box para determinar si
los residuos están realmente correlacionados y se
encontró que nuestra serie efectivamente presenta
autocorrelación. b) El promedio de los residuos debe ser
nula, si esto no se cumple, estaremos ante un resultado
sesgado de los pronósticos. Para nuestro caso, esto se
cumplió satisfactoriamente. c) Los residuos deberían
presentar varianza constante, en este trabajo se utilizó la
prueba de McLeod-Li que consiste en una prueba de
heterocedasticidad condicional autorregresiva para una
serie de tiempo y se concluye que existe presencia de
heterocedasticidad.
Realizar predicciones sobre series temporales no es una
tarea fácil. La razón radica en que las observaciones de
una serie temporal dependen casi solo de sus valores
pasados y esta dependencia tiene un valor que es más alto
cuando se trata de observaciones recientes y más bajo
cuando se trata de observaciones lejanas en el tiempo.
Los modelos ARIMA se preocupan de hacer que una
serie se vuelva estacionaria y para esto realizan diferentes
técnicas como la diferenciación de la serie. Para medir el
grado de estacionariedad, se preocupan de medir las
autocorrelaciones de la serie, de modo que se obtenga
una serie sin tendencia y varianza constante en la que se
puedan realizar predicciones de mejor manera. También
se realiza una diferencia estacional para eliminar
justamente la estacionalidad de la serie. El paquete R
permite realizar una optimización en este sentido al
calcular el mejor modelo ARIMA.
Las redes neuronales son parte de las nuevas tendencias
que tienen que ver con el aprendizaje de máquinas y la
inteligencia artificial. En este sentido al utilizar una red
neuronal como modelo para realizar predicciones en una
serie de tiempo, la red utiliza los datos como entradas al
modelo y el modelo calcula las correspondientes salidas
que irán a nuevas entradas y con esto se construyen las
capas de la red. Esto hace que la red aprenda de los datos
que ingresan en las entradas y se obtenga una salida de
aprendizaje que trate de minimizar los errores de
predicción. En nuestro caso, hoy el modelo que obtuvo el
valor más bajo de error RMSE es justamente el modelo
de redes neuronales.
REFERENCIAS
[1] S. Ortiz (22, Dic 29) “Ecuador cierra el 2022 con
la peor tasa de homicidios de la historia.”
https://www.expreso.ec/actualidad/ecuador-cierra-
ano-tasa-homicidios-25-5-peor-historia-
145484.html (accessed May 07, 2023).
[2] A. L. Santillán Molina et al., “Drogas, tráfico y
crimen organizado como detonante de actos
violentos en las cárceles del Ecuador,” Revista
Universidad y Sociedad, vol. 14, no. 3, pp. 478
486, 2022, Accessed: May 07, 2023. [Online].
Available:
http://scielo.sld.cu/scielo.php?script=sci_arttext&p
id=S2218-
36202022000300478&lng=es&nrm=iso&tlng=en
[3] A. C. Juárez, C. A. Zuñiga, J. L. M. Flores, and D.
S. Partida, “Análisis de series de tiempo en el
pronóstico de la demanda de almacenamiento de
productos perecederos,” Estudios Gerenciales, vol.
32, no. 141, pp. 387396, doi:
10.1016/J.ESTGER.2016.11.002.
[4] D. R. (David R. Anderson, D. J. Sweeney, and T.
A. Williams, “Estadstica para negocios y
economa,” p. 1080, 2012.
[5] R. J. Hyndman, “Forecasting: Forecasting:
Principles & Practice,” no. September, p. 138,
2014, Accessed: May 07, 2023. [Online].
Available:
robjhyndman.com/uwa%5Cnhttp://robjhyndman.c
om/papers/forecasting-age-specific-breast-cancer-
mortality-using-functional-data-models/
[6] S. Siami-Namini and A. S. Namin, “Forecasting
Economics and Financial Time Series: ARIMA vs.
LSTM,” Mar. 2018, Accessed: May 07, 2023.
[Online]. Available:
http://arxiv.org/abs/1803.06386
[7] Z. Pala and R. Atici, “Forecasting Sunspot Time
Series Using Deep Learning Methods,” Sol Phys,
vol. 294, no. 5, pp. 114, May 2019, doi:
10.1007/S11207-019-1434-6/METRICS.
[8] A. DE Técnicas Econométricas Y and A. Ramón
Chung Pinzás, “APLICACIÓN DE TÉCNICAS
ECONOMÉTRICAS Y MACHINE LEARNING
PARA SERIES DE TIEMPO UNIVARIADAS EN
UNA ESCUELA PROFESIONAL DE UNA
UNIVERSIDAD PÚBLICA,” Veritas, vol. 23, no.
1, pp. 4751, Jan. 2023, doi:
10.35286/VERITAS.V23I1.335.
[9] INEC, “Justicia y crimen”
https://www.ecuadorencifras.gob.ec/justicia-y-
crimen/ (accessed May 07, 2023).
Vivas K. y Vivas D.
11
Anexo
Figura 6.
Los p-valores para la prueba de McLeod-Li.