5
tos. Sería difícil conocer el apoyo de cierta raza, grupo de
edad o cierta clase social hacia los partidos políticos. Este
es el denominado problema de la inferencia ecológica y
fue abordado desde el siglo anterior por varios autores
que propusieron métodos para su solución como el de-
terminístico de los intervalos, [2] la regresión ecológica,
[3] el método [4] o más recientemente con técnicas de
aprendizaje para regresiones de distribución, [5] técnicas
de programación lineal, [6] técnicas de optimización, [7]
entre otros. A pesar de sus deciencias, la inferencia eco-
lógica sigue siendo una parte necesaria de algunas áreas
de inferencia cuantitativa. Algunos ejemplos en el campo
de las ciencias políticas electorales son [8], [9] y [10].
Para la construcción de las tablas de contingencia se
tomaron dos fuentes de datos: la información que pro-
porciona el , [13] sobre la población por edades para
cada parroquia y los resultados ociales de la contienda
electoral en cada parroquia. La primera base de datos nos
permite dividir al electorado en grupos de edades, más es-
pecícamente se ha dividido la población en los grupos de
edad: 16-29, 30-44, 45-60 y >60 años. Se obtuvo la canti-
dad de personas en cada parroquia que pertenecen a es-
tas clases. La segunda base de datos nos permite ver el
apoyo hacia los dos partidos políticos de forma agrega-
da para la contienda electoral del 2013, de modo que se
tengan tres grupos: cantidad de votantes que apoyaron al
partido ganador , cantidad de votantes que apoyaron
al partido y cantidad de votantes que optaron por
apoyar a otro partido político, abstenerse o anular el voto.
Estos modelos tienen algunas desventajas: 1) existe
poca investigación sobre la precisión de los métodos que
extienden la inferencia ecológica al caso RxC; 2) se debe
tener precaución al utilizarlos, especialmente en aque-
llos casos en los que las estimaciones involucran tablas
1 En Ecuador, las parroquias son parte de la división política
y en este trabajo serán tratadas como recintos electorales.
2. Método
Las cantidades marginales por recinto electoral y
, se las puede obtener en los resultados de las contien-
das electorales por cada parroquia y son las cantidades to-
tales de votos que recibieron y , respectivamente,
la tercera columna muestra los votos anulados y absten-
ciones. Las cantidades marginales X
1i
, X
2i
y X
3i
se las pue-
de obtener en la información que proporcionan los censos
nacionales y corresponden a los grupos de edades respec-
tivos. Sin embargo, las cantidades al interior de la tabla no
se las puede conocer directamente dado que el voto es se-
creto. De este modo, se trata de inferir las intersecciones
de la tabla de contingencia: .
Tomando la nomenclatura de [11] la información
consta de recintos electorales (parroquias), para cada re-
cinto i (i=1,2,…,p), se tiene la cantidad de personas que
acudieron a las urnas. Podemos observar las proporcio-
nes del electorado que apoyaron a un partido especíco:
T1i,T2i,…,TCi. y las fracciones del electorado en las diferen-
tes clases de edad: X1i,X2i,…,XRi. Las variables de interés
a inferir son las fracciones del electorado que pertene-
cen a la clase , que votaron por el partido , donde
r=1,…,R,c=1,…,C-1.
2.1. LOS MODELOS BAYESIANOS
El paradigma bayesiano arma que la probabilidad de
un evento puede estar sujeto al grado de creencia que
tengamos sobre ese evento, de hecho, en los modelos
bayesianos están sujetos a esta idea, por tanto, se les
asigna dicho grado de creencia. Esto implica que, de
acuerdo con nuestro grado de creencia, podemos elaborar
de contingencia grandes, las estimaciones pueden resul-
tar sesgadas en los casos en que los partidos políticos son
pequeños; [14] 3) suelen apoyarse en supuestos que son
difíciles vericar, en la mayoría de casos requieren una
considerable capacidad de hardware para ser implemen-
tados y aun así no lograr la convergencia para los algo-
ritmos . Sin embargo, hay evidencias en favor de
utilizar estos métodos de inferencia para obtener estima-
ciones válidas sobre este tipo de fenómenos [14].
Para realizar las inferencias, este trabajo aplicó un
modelo jerárquico bayesiano para tablas de contingencia
de tamaño RxC [11] sin el uso de covariables. Este mode-
lo es una extensión del modelo jerárquico bayesiano para
el caso de tablas 2x2 [12]. Dada la complejidad de los cál-
culos de las distribuciones para los parámetros de inte-
rés, se utilizaron técnicas computacionales Markov Chain
Monte Carlo mediante el lenguaje RStan para la con-
guración del modelo. Los resultados obtenidos son las
inferencias sobre los parámetros de las distribuciones a
posteriori para las variables de interés. Esto permitió pre-
sentar los resultados en forma geográca a nivel de pa-
rroquias1 para los partidos de la contienda electoral y se
analizaron los resultados.
La inferencia ecológica es el proceso de aprendizaje acer-
ca del comportamiento individual a partir de datos agru-
pados, es decir, hacer predicciones a nivel desagregado a
partir de datos agregados [15]. Una manera de entender
el problema de la inferencia ecológica es considerar una
tabla de contingencia cuyas entradas dentro de ella sean
desconocidas y sus marginales conocidas. Tomemos la
siguiente tabla de contingencia de tamaño RxC, donde
R=4 y C=3 (ver Tabla 1).
Estadística Bayesiana para la Inferencia sobre el Comportamiento Electoral