Eduardo Arriagada, en su blog en Comunicaciones de la UC, hizo un post sobre que en Chile no había sorpresas en las elecciones. En el blog se mostraba un gráfico creado por Roberto Méndez en que se planteaba que, básicamente, todas las encuestas -si uno contaba sólo los votos válidamente emitidos- habían estado cerca del resultado. En ese sentido, la elección había estado decidida hace varios meses.
Carlos Hunneus, que en El Mostrador ha escrito varias columnas sobre su predicción de resultados, escribió otra columna que Arriagada también publicó en su blog. En esa columna, luego de insistir que CERC fue el único que realizó predicciones, que todos son generales después de la batalla escribió lo siguiente:
En tercer lugar, la igualación del desempeño de las encuestas no es correcto, porque se hace cometiendo manipulación estadística, porque se sacan las respuestas no sabe/no responde, nulos y blancos después de las elecciones. Esta práctica, iniciada por Roberto Méndez después de las elecciones presidenciales de 1999, no ha conducido a que los encuestadores hagan este ejercicio antes de las elecciones presidenciales de 2005 y del 13 de diciembre, sino que después. El encuestador debe decir antes cual será el resultado, sabiendo que en Chile es sobre los votos validamente emitidos. No se puede ser general después de la batalla.
Y no se ha hecho por una razón muy simple, este es mi cuarto punto: los NS/NR no se pueden eliminar, porque una buena parte de ellos es voto escondido y debe ser asignado correctamente. Hay distintas maneras de hacerlo: mediante la aplicación de otras preguntas electorales y de temas políticos (asi lo hacemos en el CERC) o mediante una distribución proporcional según las respuestas de intención de voto o una combinación de ambas. El segundo ejercicio es riesgoso, porque puede llevar a sobreestimar al candidato que tiene un clima electoral muy favorable, que lo hace aparece como ganador.
Saber interpretar a los no sabe/no responde, este es otro punto que quiero aclarar, no es una elegancia académica, sino que es una exigencia profesional, para trabajar con la realidad y no con fabricaciones de ella
El problema es que no es ninguna manipulación estadística contar para calcular los porcentajes de votos sólo las preferencias de los candidatos. Los porcentajes de las elecciones se calculan sobre votos válidamente emitidos, no sobre el total de inscritos. Y ambos universos son distintos, por lo que no queda más que calcular los porcentajes como corresponde.
De hecho, es sencillamente incorrecto plantear que “los NS/NR no se pueden eliminar, porque una buena parte de ellos es voto escondido y debe ser asignado correctamente”.
La encuesta CEP de Octubre, para dar el ejemplo más claro, plantea que un 14% de los inscritos fueron NS/NR (link aquí). Bueno, ¿cual es el porcentaje de personas inscritas en los registros electorales que no dieron un voto válido en la elección reciente?
De acuerdo a elecciones.gob.cl el número de votos válidamente emitidos fue de 6.937.519 votos. El número de inscritos de acuerdo al SERVEL a Septiembre del 2009 fue de 8.285.186 (lamentablemente no hay datos más recientes). La diferencia corresponde al 16%.
En otras palabras, el porcentaje de NS/NR de la encuesta del CEP corresponde con pequeña diferencia (que es parte del margen de error) al porcentaje que no expresó preferencia por candidato alguno: No votaron, anularon, votaron en blanco etc. En otras palabras, no hay que asignarlos a candidato alguno, porque no votaron por algún candidato.
O sea, el universo de votos válidos (casi 7 millones) no es el universo de inscritos (8 millones y algo). Y para hacer comparable porcentajes calculados con respecto a esos universos distintos, tengo que hacer el calculo correspondiente. Eso no es ningún truco o manipulación estadística. Es sencillamente reconocer que hay gente que no vota en las elecciones. Que es un dato de la realidad. Perdón que son 1.327.667 datos de la realidad.