Wenceslao Vargas Márquez
Dijo alguien que hay mentiras pequeñas, mentiras grandes y estadísticas. Nos parece erróneo. Nosotros creemos que hay mentiras chicas, mentiras grandes, estadísticas y encuestas.
Hoy nos proponemos salvar la reputación de las encuestas recordando un proceso que ayuda a su interpretación conjunta: proponemos desde este espacio que se desdeñen las encuestas y que mejor tratemos de interpretar las encuestas de encuestas (poll of polls) que procesan conjuntos de encuestas. Tiene ventajas.
Las agregadoras de encuestas hacen dos cosas: primero, algo parecido a lo que los jueces de clavados que quitan los valores extremos de las calificaciones que le dan a un clavadista en particular y promedian las cifras restantes. Le quitan “el ruido” a la medición.
Además añaden una ponderación que es algo como lo que hace un docente cuando le aplica distintos valores al examen (40%), a las tareas (30%), a la asistencia (10%), a la conducta (20%), para asignar una calificación final. Así la agregadora pondera el tamaño de muestra, el margen de error, precisión histórica de la encuestadora, modo de levantamiento (domicilio o teléfono), etc.
Idea gráfica de la propuesta de regresión lineal. Imagen: Numerictron |
Hecha esta profesión de fe (no encuestadoras, sí agregadoras) anotamos tres “polls of polls” para tener una idea de por dónde van las cifras para las elecciones presidenciales en el corte del lunes 9 de abril. Las anotamos en el siguiente orden: Oraculus, Bloomberg, El País.
Siguiendo las preferencias electorales procesadas por ellas, Amlo tiene 43%, 43.7 y 41.2; Anaya tiene 29%, 30.2 y 28.2; Meade tienen 23%, 20.3 y 21.9; Zavala tiene 6, 6.3 y 5.6
En promedio Amlo lleva sobre Anaya un poco más de 13 puntos y casi 21 sobre Meade. Amlo sobre Meade tiene una proporción de 2 a 1 y sobre Anaya de casi un 1.5 a uno. Esta es la “verdad estadística” con la que trabajamos por fuera de cualquier encuesta en particular.
Como las encuestas no abundan para el caso de Veracruz (no hay agregadoras trabajando) apuntamos que la encuestadora Opinión Pública que trabaja para SDPNoticias tiene las siguientes cifras al 8 de abril para aspirantes al senado por Veracruz: PAN 27.4%, Morena 26.7%, PRI 18.3%. Para gobernador tiene al PAN con 31.2%, a Morena con 30.5%, al PRI con 19.6%
Por otro lado, hay una cosa importante que las encuestadoras normalmente no muestran y que son los ritmos de crecimiento de los candidatos en un periodo de tiempo. En un papel blanco puede el lector colocar dos puntos y podrá trazar a través de ellos una, y sólo una recta (y podrá obtener su ecuación y su ritmo de crecimiento).
Si el lector coloca tres puntos no alineados podrá trazar algo que es una especie de recta promedio que pasará cerca de los tres puntos, y esa “recta emblema”, “recta promedio”, es representativa de los tres puntos no alineados.
Su inclinación se mide en la primaria en grados y con un transportador, en matemáticas intermedias con el concepto de pendiente y en matemáticas superiores con la idea de derivada. Es lo mismo. Su medida indica qué tanto la recta sube o baja. Incluso (y mejor), si los puntos son muchos al grado de formar una nube de puntos puede construirse una “recta emblema” que sea representativa de todos los puntos. Parecerá exactamente una flecha atravesando una nube.
El método más recurrido para construir una recta de este tipo (y su ecuación) es el que se conoce como el de mínimos cuadrados. Esta es la idea de lo que plantearemos a continuación: los porcentajes de intención de voto de una encuesta semana a semana, tales como los valores de la encuestadora Massive Caller, pueden ser tratados de esta forma para construir la recta de cada candidato y examinar su crecimiento a partir de la ecuación.
Todo esto lo hacen distintos programas informáticos, Excel, por ejemplo, con dos o tres clicks, al insertar una gráfica de dispersión XY. Al tener la ecuación de la recta, su pendiente (o primera derivada) positiva nos da el ritmo de crecimiento de la preferencia electoral de ese candidato; un signo negativo nos indica caída.
Procesada así la información de Massive Caller (que se presta fácilmente para generar la nube de puntos ya que da información semanal para aspirantes al senado y gobernadores, y diaria para la presidencial), tenemos al 5 de abril para candidatos a senadores por Veracruz la siguiente cifra y el crecimiento promedio de las últimas cuatro semanas:
Al 5 de abril el PAN es preferido por el 32.42% y, según su recta, crece +.39,
A Morena lo prefieren 30.2% y crece según +.74,
Al PRI lo prefieren el 16.97% del electorado y aumenta su preferencia al ritmo de +.56
Veracruz * Caída de -0.612 en la preferencia electoral para gobernador por el PRI Su ecuación: y = -.0612x + 15.412 |
Al 3 de abril al PAN lo prefieren el 33.37% y crece tanto como +0.74. Su crecimiento ha sido +0.98, +1.0, +0.89, +0.74; vemos un ritmo de crecimiento que disminuye.
A Morena lo prefiere el 28.73% y cae con -0.042; su crecimiento ha sido +0.95, 0.0, +0.004, -0.042; vemos un crecimiento nulo o caída muy moderada.
Al PRI lo prefiere un 12% y cae -0.612; su crecimiento ha sido +0.99, -0.14, -0.43, -0.612; el PRI profundiza su ritmo de caída en preferencias para gobernador. Este dato es consistente con los 12 puntos porcentuales de preferencia en el levantamiento más reciente (3 de abril) y que es el más bajo que ha tenido el aspirante Yunes Zorrilla.
Todas estas cifras se modifican con el siguiente levantamiento de datos.
Los datos porcentuales de preferencia electoral son de Massive Caller y la interpretación de la regresión lineal por mínimos cuadrados, propuesta para calcular los crecimientos electorales, es por completo nuestra responsabilidad.
:::