Mostrando las entradas con la etiqueta YV Polis. Mostrar todas las entradas
Mostrando las entradas con la etiqueta YV Polis. Mostrar todas las entradas

domingo, 30 de septiembre de 2012

Combinando las Encuestas - Entrega 8. Artículo de @YVpolis Iñaki Sagarzazu

Iñaki Sagarzazu

En Twitter: @YVpolis

yvpolis.blogspot.com

Esta es la oportunidad en la que hago este análisis tan cercano a uno previo (el anterior lo hice hace solo tres días). Sin embargo, en estos últimos días de publicación de encuestas la mayoría de las consultoras del país han hecho públicos sus estudios de opinión. La pasada entrega (entrega 7) no incluía los últimos sondeos de Hinterlaces, Consultores 21, Varianzas, GIS XXI, Predicmatica, Hercon y Consultores 30.11.

La pasada entrega puso a Henrique Capriles-Radonski a 4 puntos por debajo de Hugo Chávez. En esta oportunidad el análisis pone a Capriles 2 puntos por encima de Chávez, claro está estos números están dentro del margen de error. Los sesgos (más abajo) siguen iguales.

martes, 25 de septiembre de 2012

Combinando las encuestas - Entrega 7. Artículo de Iñaki Sagarzazu @Yvpolis

Iñaki Sagarzazu

En Twitter: @Yvpolis

yvpolis.blogspot.co.uk

Ya a menos de dos semanas de las elecciones traigo lo que puede ser el penúltimo análisis de las encuestas. En esta séptima entrega vemos que la brecha sigue disminuyendo (en la entrega 6 era de 6 puntos porcentuales. En esta oportunidad es de 4. Salvo la disminución de 2 puntos en un mes en la brecha no hay más novedades (los sesgos siguen igual - ver más abajo).

HCF 52% -HCR 48%

Sesgos de encuestadoras:

domingo, 23 de septiembre de 2012

Evolución de las tendencias... Artículo de Iñaki Sagarzazu @YVpolis

Aprovecho esta oportunidad en la que estamos a tres semanas de las elecciones para reportar como ven las elecciones las diferentes encuestadoras.

Iñaki Sagarzazu

En Twitter: @YVpolis

ElUniversal

- Consultores 21: Ha dado la elección cerrada de forma consistente. En sus últimas dos encuestas Capriles está por encima de Chávez.

- Consultores 30.11: Da constantemente a Chávez por encima de 50% con poca variación. Sin embargo muestra a Capriles subiendo. Hay que considerar su alto sesgo pro-gobierno (ver aqui o aqui).

- Datanalisis: Muestra a Chávez constantemente liderando pero con un número de indecisos más grande que la brecha. En sus encuestas con entrevistas en hogares (no las telefánicas realizadas en el último mes) muestra a Capriles subiendo rapidamente.

- GISXXI: Su alto sesgo pro-gobierno (ver aqui o aqui) hace ver que la elección está ganada y que es una perdida de tiempo. Si correjimos por sus 15 puntos de sesgo entonces la cosa no está tan clara.

- Hinterlaces: Muestra a Chávez rondando el 50% (por debajo), es la única encuestadora que muestra una tendencia consistente de disminución de votos para Capriles...sí, la única.

- ICS: Junto con Consultores 30.11 y GISXXI muestran una brecha enorme e insuperable... se aplica el mismo comentario (ver aqui).

- IVAD: Muestra tanto a Chavez como a Capriles bajando, aunque la caida de Capriles paro.

- Keller: No tengo más que un punto.

- Otras (ventaja Chávez): Un grupo de encuestadoras de las que tengo poco conocimiento y más importante tengo pocas encuestas (<3) y que muestran a Chávez arriba constantemente...

- Otras (ventaja Capriles): Un grupo de encuestadoras de las que tengo poco conocimiento y más importante tengo pocas encuestas (<3) y que muestran a Capriles arriba constantemente... Keller podría pertenecer a este grupo...

- Predicmatica: Aparece sola porque ya han publicado tres encuestas, pero mis amigos de Caracas Chronicles dudan de su calidad. Muestran una elección cerrada con Capriles arriba (antes pertenecia al grupo de Otras).

- Varianzas: Como C21 ha mostrado la elección cerrada desde el principio. Sin embargo, en análisis previos (ver aqui o aqui)no le he encontrado ningún sesgo así que pareciera ser la que está representando las cosas correctamente...amanecerá y veremos

jueves, 23 de agosto de 2012

No todas las encuestas son iguales. Artículo de @YVpolis

YV Polis (Iñaki Sagarzazu)

En Twiter: @YVpolis

yvpolis.blogspot.com/

En estas dos semanas han sido publicadas entre 5 y 6 encuestas. GisXXI, Consultores 30.11, Hinterlaces, Predicmatica, Hercon, y Varianzas han hecho públicos números de cómo va la “Carrera” a Miraflores. Al ver las encuestas de todas estas compañías lo primero que uno se pregunta es: ¿cómo es posible que una arroje 60-30 y la otra dé 47-49? A esta pregunta le sigue otra: ¿no se supone que las encuestas se hacen usando técnicas estadísticas, matemáticas, que hacen que estas diferencias no existan? Y finalmente uno se pregunta: ¿cuál es la realidad? Dependiendo del interés del lector en las encuestas y en la elección, muchas más preguntas y dudas se pueden dar, pero estas tres son básicas. Intentaré en este breve espacio ofrecer mis respuestas a estas interrogantes.

  • Cómo es posible que una encuesta arroje 60-30 y otra dé 47-49?
  • Hay varias razones por las que dos encuestas pueden dar números tan diferentes. La más básica es que las encuestas fueron hechas en distintos momentos. Un mes es suficiente para que una cambie radicalmente la intención de voto.

    Sin embargo, cuando las encuestas son contemporáneas, hay que buscar más allá de la fecha para encontrar estas variaciones. Varias pueden ser, entonces, las causas de estas diferencias, y dos sumamente importantes son:

    a. El cuestionario: el tipo de pregunta que se hace, y el orden de las preguntas son muy importantes. No es lo mismo preguntar: ¿Por quién vas a votar? (pregunta abierta) a preguntar: Entre Chávez y Capriles ¿por quién votarías? (pregunta cerrada). Tampoco es igual preguntar primero por la intención de voto y luego por la opinión sobre Mercal, a hacerlo al revés. El problema aquí es que una pregunta puede influenciar las respuestas a preguntas subsiguientes.

    b. La muestra de la población: para obtener una representación real de la opinión del electorado, uno debe asegurarse de que tiene una buena muestra de este electorado. Por ejemplo, no es lo mismo entrevistar a gente en Caracas que en el interior, e inclusive no es lo mismo Aragua que Apure. Lo mismo sucede con los estratos sociales, el género, la edad, etc. Una muestra correcta es aquella que no sólo es aleatoria sino que además es característica de la población que intenta representar.

  • No se supone que las encuestas se hacen usando técnicas estadísticas, matemáticas, que hacen que estas diferencias no existan?
  • En principio sí. Dos encuestas hechas bajo los mismos parámetros deberían ser relativamente similares. Sin embargo, por razones del juego político en nuestro país se han abierto una serie de encuestadoras de “dudosa” reputación. Digo dudosa porque tienen poco historial: sus técnicas, clientes, métodos, oficinas, pagina web, usuario de twitter, etc. son inexistentes, desconocidos, o de muy reciente data (o todas las anteriores). Si uno deja de prestarle atención al grupo de encuestadoras nuevas ve como las cosas comienzan a cambiar, y los márgenes de diferencia se acortan. Sin embargo, siguen existiendo diferencias.

  • ¿Cuál es la realidad?
  • En un ambiente tan volátil como el venezolano, actualmente es difícil saber exactamente cual es la realidad. Lo que a mi me gusta recomendar es ver las tendencias. Dos tendencias son particularmente claras, inclusive al ver las encuestas del GisXXI y de Consultores 30.11. Estas dos tendencias son:

    a. La intención de voto a favor de Chávez alcanzó un techo. Algunas encuestadoras dicen que el techo es 57% otras dicen que el techo es 45%. Lo que importa es que no ha subido nada desde marzo. Es más, basados en la ultima encuesta de GisXXI ha bajado.

    b. La intención de voto a favor de Capriles ha venido subiendo consistentemente. Algunas encuestadoras lo ubican en 48% mientras que otras en 30%, de nuevo lo importante es que desde su victoria en las primarias ha subido consistentemente.

    Estas dos tendencias generan a su vez dos preguntas: ¿puede Capriles alcanzar a Chávez? ¿Qué va a pasar el 7-O?

    Como no soy adivino no me atrevo a predecir el futuro, pero si puedo decir que viendo cómo van las cosas, no sólo los números sino el desenvolvimiento de la campaña, y las acciones de los diferentes actores políticos (de gobierno y oposición), podemos decir que la cosa esta muy pareja. De seguir las cosas como van, el final va a ser de fotografía.

    Visite http://yvpolis.blogspot.com/

    viernes, 3 de agosto de 2012

    Encuestadoras Venezolanas, sus records y la Elección del 2012. Artículo de YV Polis

    YV Polis (Iñaki Sagarzazu)

    En Twitter: @yvpolis

    El próximo 7 de Octubre los venezolanos escogeremos el presidente de la republica que gobernará los próximos 6 anos, las dos opciones: Hugo Chávez y Henrique Capriles Radonski. En este blog he hecho diferentes análisis históricos así como análisis de la evolución de las encuestas actuales. Lo que no he hecho es presentar un análisis que mezcle ambos. En esta oportunidad utilizo 64 encuestas para presentar un análisis de sesgo pro-gobierno y pro-oposición en cinco procesos electorales: El referendo revocatorio de 2004, la elección presidencial de 200, los referendos de 2007 y 2009, y la elección parlamentaria de 2010. Este análisis, originalmente escrito en inglés como contribución al blog “Venezuelan Politics and Human Rights” lo traduzco, con ciertas modificaciones, en esta entrada del blog. (El artículo original se encuentra aquí). Veamos entonces los números.



    Referendo Revocatorio de 2004

    La figura 1 presenta la última encuesta, antes del revocatorio, llevada a cabo por cada una de las encuestadoras. Las barras horizontales azules muestran la predicción de votos de la opción opositora (SI), mientras que la barra roja muestra la intención de votos de la opción oficialista (NO). Las líneas verticales representan el resultado real de la elección. Entonces, cuando vemos la figura 1 se puede observar claramente que tres encuestadoras predijeron con relativa certeza el resultado electoral: Datanalisis, Hinterlaces y  Varianzas. Al contrario, dos encuestadoras predijeron que la oposición ganaría: Datos predecía que la oposición ganaría ampliamente mientras que Consultores 21daba un resultado más parejo.


    Figura 1. Predicción de la última encuesta antes del Revocatorio

    Estos resultados se repiten cuando vemos el sesgo pro-gobierno y pro-opositor. En la figura 2 incluyo todas las encuestas de las diferentes encuestadoras durante el proceso del 2004. El gráfico incluye el promedio de las diferencias entre el resultado real y las predicciones de cada encuestadora. Como se puede observar, tanto Consultores 21 como Datos tienen sesgos significativos en favor de la oposición mientras que las otras tres encuestadoras muestran sesgos muy bajos.


    Figura 2. Sesgo promedio por encuestadora en encuestas previas al Revocatorio


    Elección presidencial de 2006

    Como punto de partida para este análisis debo decir que no creo que la elección presidencial del 2006 sorprendiera a nadie. A través de todo el proceso se hizo evidente que Chávez ganaría sin mayores dificultades la elección contra Manuel Rosales. Sin embargo, siempre existieron rumores sobre el voto secreto y la “espiral del silencio”; esto, se argumentaba, haría la diferencia para darle la victoria a Rosales.
    Los dos gráficos siguientes no representan ninguna sorpresa sino más bien una confirmación del análisis de esta elección. La mayoría de las encuestadoras pudieron predecir con relativa certeza los resultados, por ejemplo Consultores 21 tiene menos de un 5% de sesgo pro-oposición. La única encuesta que  exhibe un sesgo extremadamente alto en favor de la oposición es la realizada por el Observatorio Hanna Arendt, que utilizo lápices de tres colores como método para predecir el ganador, esto basado en la teoría dela espiral del silencio. Utilizando este método en el cual se divide la muestra de participantes en tres grupos y a los integrantes de cada grupo les corresponde votar con un lápiz de un color (amarillo, azul o rojo), se encontró una diferencia muy grande entre la intención de voto del grupo que votaba con lápiz rojo y del que votaba con lápiz azul.


    Figura 3. Predicción de la última encuesta antes de la elección presidencial

    Figura 4. Sesgo promedio por encuestadora en encuestas previas a la elección presidencial



    Referéndum Constitucional del 2007


    El referendo del 2007 es interesante porque fue una elección muy cerrada. Es también la elección en la que empezamos a ver la existencia de encuestadoras no-tradicionales con amplios márgenes de ventaja para el gobierno. En cuanto a los resultados vemos que tres firmas lograron predecir correctamente la elección en su última encuesta, estas son: Consultores 21, Datanalisis e Hinterlaces. Por el contrario, tres encuestadoras hicieron un análisis que distaba bastante de los resultados reales: 30.11 Consultores, IVAD y Keller.


    Figura 5. Predicción de la última encuesta antes del referendo



    La figura 5 compara la última predicción de cada encuestadora con el resultado de la elección. Cuando se promedian los sesgos de las diferentes encuestas vemos algunas diferencias (figura 6). Igual que en el grafico anterior vemos sesgos considerables en favor del oficialismo por Consultores 30.11 y por el IVAD. Vemos sesgos de tamaño mediano (5 puntos) por Datanalisis (en favor de la oposición) y Keller (pro gobierno). Y vemos sesgos pequeños en las encuestas de Consultores 21 e Hinterlaces. Estas diferencias son en parte debido a la naturaleza cambiante de la elección que se volvió más y más cerrada a medida que discurría la campaña.

    Figura 6. Sesgo promedio por encuestadora en encuestas previas al Referendo





    Referendo Constitucional 2009

    Encontrar encuestas para el referéndum del 2009 fue bastante difícil. Para este proceso solo pude obtener datos verificables de 5 encuestas: 3 de Datanalisis y 2 de Hinterlaces. Sin embargo, dada la importancia de esta elección decidí utilizar un juego de datos que no pasaría los estándares normales de las publicaciones académicas: el artículo de Wikipedia sobre el referéndum del 2009. Gracias a este artículo logre obtener información de 23 encuestas de 8 encuestadoras diferentes. De estas encuestas, sin embargo, solo pude verificar independientemente 2 ya que los links de las otras no se encuentran activos. La figura 7 muestra la ultima encuesta para cada consultora. Como se puede observar existe un sesgo bastante alto en favor de la oposición. Igual que en los análisis anteriores, para cada una de las encuestadoras obtuve el promedio de sus errores (que se pueden observar en la figura 8). Como se puede observar Keller e Hinterlaces tienen los sesgos pro-oposición más grande. Asimismo se puede ver como la mayoría de las encuestadoras erraron del lado de la oposición. Resulta interesante que tanto el IVAD como GISXXI, dos encuestadoras que usualmente tienen sesgos grandes, estuvieron acertados en esta oportunidad.


    Figura 7. Predicción de la última encuesta antes del referendo

    Figura 8. Sesgo promedio por encuestadora en encuestas previas al Referendo


    Elección Parlamentaria de 2010

    La ultima elección en la que participamos los Venezolanos, antes de esta elección presidencial que se avecina, fue la elección de los miembros de la Asamblea Nacional en 2010. Esta elección, como la del 2007, fue muy cerrada –por lo menos en cuanto al porcentaje de votos-. La diferencia de votos entre el gobierno y la oposición fue muy difícil de predecir y (como se puede ver en la figura 9) solo una encuestadora logro predecir en su última encuesta: Hinterlaces Consultores 21. Dos encuestadoras más estuvieron cerca también Consultores 21 Datanalisis y Varianzas, a su vez seguidas por Hinterlaces y GISXXI. Del otro lado de Hinterlaces Consultores 21 se encuentra GISXXI IVAD, que erró del lado del gobierno en más de 10 puntos porcentuales.

    Figura 9. Predicción de la última encuesta antes de la elección parlamentaria



    Mientras la ultima encuesta provee resultados interesantes, ver los promedios de estos errores nos da una idea mas completa de la elección. En la figura 10 podemos ver que tres encuestadoras tuvieron un sesgo pro-gobierno de más de 5 puntos porcentuales: Datanalisis, GISXXI e IVAD. Una encuestadora, Keller, tuvo un sesgo mediano en favor de la oposición, y otras tres tuvieron sesgos pequeños en favor de la oposición: Consultores 21, Hinterlaces y Varianzas.


    Figura 10. Sesgo promedio por encuestadora en encuestas previas a la elección parlamentaria


    La elección del 2012

    Qué significa todo esto? Significa que las encuestadoras cometen errores, típicamente favoreciendo al mismo lado – aunque existe cierta variación. La tabla siguiente muestra el error promedio de cada encuestadora a favor del gobierno (fila superior) y a favor de la oposición (fila inferior). Números positivos indican que la encuestadora dio mayor intención de votos que los votos reales que obtuvo una opción. Números negativos indican que la encuesta daba números por debajo de la realidad. Por ejemplo, Datanalisis ha cometido errores tanto a favor del gobierno (2006 y 2010) como a favor de la oposición (2004 y 2007); lo mismo ocurre con el IVAD que ha cometido errores grandes pero en lados diferentes. Otras consultoras por el contrario son más consistentes en el lado al que tienden a favorecer. Por ejemplo, Consultores 21 tiende a favorecer a la oposición. Hay una encuestadora (de la que tengo poco conocimiento) que ha sido bastante consistente en tener errores muy bajos. Esta encuestadora, Varianzas, ha cometido errores que están dentro del margen de error de sus encuestas. Sin embargo, solo cuento con encuestas de dos procesos electorales para esta firma. La última columna indica el error promedio de los cinco procesos electorales para cada encuestadora.


    Tabla 1. Sesgos por encuestadoras y proceso electoral


    La tabla 2 muestra la ultima encuesta de cada encuestadora para este proceso electoral. Incluye las fechas de inicio y cierre de campo y la predicción. Yo agregue tres columnas que llamo predicción “corregida”. Dos de estas representan escenarios electorales diferentes. En el primer escenario, se piensa que la oposición esta por delante pero termina perdiendo (como en 2004 y 2009); este escenario utiliza el error del 2009 para generar una corrección. En el segundo escenario se piensa que el gobierno va por delante pero termina ganando la oposición (como en 2007 y –relativamente- en 2010); en este caso se utiliza el error del 2010 como factor de corrección. Finalmente existe un escenario intermedio que utiliza el promedio de los errores para corregir las diferentes predicciones de cada encuestadora.
    La última fila de la tabla indica el promedio de todas las encuestas y todas las correcciones. Los tres escenarios “corregidos” apuntan a donde puede terminar la elección del 2012 en base a las encuestas actuales y en base a cada uno de los posibles escenarios. Por ejemplo, si la dinámica de la elección es similar a la del 2009 entonces esta elección presidencial seria como la del 2006 y terminaría en una victoria amplia de Chávez. Si, por el contrario, la dinámica es mas como las elecciones de 2007 y 2010 entonces los indecisos, o Ni-Ni, serán un factor importante. Según esta dinámica la diferencia entre Chávez y Capriles se reduciría a  12 puntos, con Chávez por debajo del 50%. Finalmente, utilizando la corrección en base al promedio Chávez tendría una ventaja de 19 puntos.


    Tabla 2. Predicciones corregidas


    En este punto tengo que decir que, en base a otros análisis que he realizado y puesto en este blog, me inclino hacia el escenario número 2 que indica que la elección se encuentra en 46-34. Esto no solo es consistente con mis análisis sino además con la estrategia opositora –de unidad- que se asemeja más a las estrategias del 2007 y 2010 que a la del 2004 o 2009.
    En terminus generales estos estimados muestran una contienda en donde Chávez tiene la delantera, pero por un margen menor que el numero de indecisos. La dirección que tome este grupo de electores podría alterar significativamente la contienda. Para ver esto más claramente veamos un último grafico. La figura 11 muestra la predicción corregida promedio para las 8 encuestadoras tanto para Chávez como para Capriles. Muestra también los valores máximos y mínimos para ambos (todo esto basado en el escenario 2). La forma de interpretar este grafico es la siguiente: Chávez esta en algún punto del rango entre 39 y 49, con un promedio de 46%. Capriles está en el rango entre 27 y 43, con un promedio de 34. Estos rangos tienen 5 puntos de coincidencia, que significa es esta elección todavía no se ha decidido, especialmente si consideramos que la mayoría de estas encuestas se realizo antes de que la campaña comenzara oficialmente y que la gente empezara a prestarle atención a la elección.


    Figura 11. Rango de predicción promedio corregida









    ****** Este post fue modificado el 1/Agosto/2012 debido a un error en la creación de la figura 9. Este error no altera ninguna de las estimaciones de sesgo presentadas en la última sección del artículo.

    domingo, 22 de julio de 2012

    Combinando las encuestas - Entrega 6. Artículo de YV Polis

    yvpolis.blogspot.com

    Aprovechando que el último grupo de encuestas realizadas antes del inicio oficial de la campaña (primero de Julio) se están haciendo públicas en estos días, publico una nueva edición de este análisis que promedia las diferentes encuestas para tratar de realizar una aproximación a cómo va la intención de voto de cara a las presidenciales del 2012. A mi parecer este ejercicio es particularmente útil dadas las diferencias entre las distintas encuestas y encuestadoras.

    Básicamente las cosas no han cambiado mucho con respecto a la última entrega. Básicamente:

    1) Chávez sigue liderando (figura 1), y

    2) las encuestadoras que tienen números mas apegados a la realidad son Datanalisis, Hinterlaces y Varianzas (figura 2).

    Sin embargo, en esta oportunidad vemos que la brecha entre Chávez y Capriles Radonski es menor a los cinco (5) puntos porcentuales y se ubica en 52-48. Esta es la primera vez que el análisis me da tan cerrado y que se ubica dentro del margen de error de la mayoría de las encuestadoras y de este análisis. Es decir, el cambio entre mayo y finales de junio (que es cuando cierran los campos de todas las encuestas nuevas) es que se sigue cerrando la distancia entre Chávez y Capriles. Les dejo los gráficos para su disfrute.

    domingo, 15 de julio de 2012

    Que dicen los programas? Artículo de YV Polis

    YV Polis (Iñaki Sagarzazu)

    yvpolis.blogspot.com

    Comenzó la campaña electoral y ambos candidatos (y sus equipos) están de lleno presentándose al país, y presentando sus propuestas para el próximo sexenio y comparándolas con las del adversario. Para esto es muy útil que, gracias al reglamento electoral, los candidatos deban entregar su programa de gobierno al CNE. Sin embargo, no conozco a nadie –directamente- que se haya leído estos programas y mucho menos que se los piense leer (me incluyo en esto), así que decidí ver que dicen los candidatos contando palabras. Veamos…

    Comienzo diciendo que, y estoy seguro de que esto no será sorpresa, el programa de gobierno del presidente Chávez tiene más de 15,000 palabras mientras que el de Henrique Capriles-Radonski tiene cerca de 3,000. Al eliminar las repeticiones vemos que Chávez menciona 4,136 palabras únicas mientras que Capriles menciona 1,351. Si además de esto eliminamos las palabras que sólo se mencionan una vez entonces Chávez usa unas 1,921 palabras contra 487 de Capriles.

    Ahora, lo más interesante de los programas no es la longitud si no el contenido. Al ver lo que dicen los candidatos podemos hacer una lista de las palabras más frecuentes. El programa de Chavez se centra en lo que pareciera ser un resurgimiento del modelo de Industrialización por substitución de importaciones (ISI) –muy común en los 80-. El programa de Capriles pareciera enfocarse en temas específicos, como educación, salud, seguridad y empleo. Esto da la impresión de un candidato con una propuesta más ideológica y otro con una propuesta más pragmática, pero tal vez menos clara.

    Como siempre lo mejor es ver las nubes de palabras así que aquí se las dejo…

    sábado, 30 de junio de 2012

    En sus marcas, listos,... Artículo de YV Polis

    YV Polis (Iñaki Sagarzazu)

    yvpolis.blogspot.com

    Ya estamos por empezar oficialmente la campaña para las elecciones presidenciales que se llevaran a cabo el 7 de Octubre. Así que antes de que empiece la campaña es bueno ver donde están los números de los dos candidatos principales y cómo han evolucionado desde principios del 2011. Espero entonces traer un poco de perspectiva a este tan convulsionado espacio en el que abunda información que a su vez se contradice, generándole dolores de cabeza a más de uno que quiere saber qué está pasando. Sin más nada que decir comienzo a mostrar números y gráficos.

    En la última entrega de Combinando las encuestas mostré que hasta hace un mes se podía decir que había un empate técnico; ya que aunque Chávez estaba por arriba en intención de voto, el error que arrojaba el análisis que hice era muy grande dadas las grandes diferencias entre las diferentes encuestas. En esta oportunidad voy por una estrategia más sencilla mientras espero por más encuestas.

    Comencemos entonces por ver cómo ha evolucionado la intención de voto por Chávez y por Capriles* desde Enero de 2011.

    Al poner todas las encuestas, sin importar la encuestadora, y promediar los números en base al mes en el que se realizó la encuesta, podemos observar que el presidente Chávez cuenta con una intención de voto que ronda el 52%, mientras que el candidato de la oposición (Capriles Radonski) cuenta con un promedio del 30%. Es importante dejar claro, sin embargo, que hay un 18% de votantes que no han decidido que hacer.

    Sin embargo, como he mostrado anteriormente, no todas las encuestadoras son iguales. Existen sesgos inherentes a los cuestionarios, técnicas de muestreo, muestras, etc., que se reproducen en las diferentes encuestas de una misma encuestadora de forma bastante sistemática. Así pues, es necesario ver la evolución en base a como cada encuestadora muestra la carrera.

    Al hacer este ejercicio podemos ver que hay un grupo de encuestadoras que muestra la elección más cerrada, en estas encontramos a Consultores 21, Datanalisis, Keller, Hinterlaces y Varianzas; mientras que otras como GIS XXI, ICS, IVAD y Consultores 30.11 muestran un escenario con una ventaja más amplia a favor del candidato oficialista.

    Hago un breve corte aquí para decirle al lector que el hecho de que el CNE ahora "regulará" a las encuestadoras no creo que vaya a repercutir en la confiabilidad de los datos, ni en disminuir las diferencias entre las encuestadoras, por el contrario dará una falsa sensación de calidad.

    En un esfuerzo de entender mejor lo que sucede decidí seguir la forma en la que muchos se refieren a las encuestadoras en base a su trayectoria en el mercado venezolano. De esta forma podemos distinguir encuestadoras con una larga trayectoria (históricas) y otras de más reciente data (nuevas). Así pues agrupe en encuestadoras históricas a: Consultores 21, Datanalisis, Hinterlaces, IVAD y Keller; mientras que como encuestadoras nuevas puse a: Consultores 30.11, GisXXI, ICS y Varianzas.

    Al hacer el promedio en base a estas dos categorías obtenemos lo siguiente: - En el grupo de encuestadoras nuevas: el presidente Chávez cuenta con más del 50% de intención de votos, mientras que Capriles Radonski cuenta con alrededor del 25%.

    - En el grupo de encuestadoras históricas: el presidente Chávez cuenta con poco menos del 50% de la intención de votos, mientras que Capriles Radonski está en el 40%.

    domingo, 17 de junio de 2012

    HCR: Consistencia de mensaje. Por: Iñaki Sagarzazu

    Por: Iñaki Sagarzazu

    En Twitter: @YVpolis

    http://yvpolis.blogspot.com

    El discurso de inscripción de la candidatura ante el CNE es el cuarto discurso importante que da Henrique Capriles Radonski en su carrera a Miraflores. El primero fue cuando lanzó su candidatura, el segundo cuando vence en las primarias, y el tercero cuando recibe las credenciales de la Junta Electoral de la MUD. En todos estos discursos Capriles ha mantenido una consistencia de mensaje muy importante en una campaña electoral. Los temas de educación y progreso han sido hilo conductor de sus mensajes y de sus campañas y aunque hay obvia fluctuaciones en el grado de importancia que diferentes temas adquieren en momentos determinados la consistencia general sigue presente. Digo esto después de analizar tres de estos cuatro discursos, (1) el de lanzamiento, (2) el de la victoria en las primarias, y (3) el de su inscripción ante el CNE. Cada discurso muestra tanto la particularidad del evento como el mensaje global del candidato.

    Por ejemplo, al ver las 20 palabras más frecuentes en cada discurso vemos las dinámicas particulares de cada momento. En el discurso de lanzamiento Capriles se presenta a él y a su "autobús del progreso", en el discurso de las primarias reitera su mensaje con un llamado importante a la "Unidad" -esta palabra no estaba en su discurso anterior-; finalmente en la inscripción de su candidatura incluye nuevas palabras relacionadas directamente al acto como "candidato" o "salgamos" (a votar).

    En cuanto a la similitud de los discursos se puede decir que Capriles no solo utiliza los mismos elementos en sus diferentes mensajes sino que los utiliza en una proporción similar. Al hacer un análisis de frecuencias de las diferentes palabras se observa que estas se comportan de manera similar en los diferentes discursos. Esto es importante ya que permite al candidato afianzar su mensaje y al elector conocer al candidato. En general se puede ver que Capriles mantiene una consistencia de mensaje bastante alta, la única inconsistencia que me pareció interesante con respecto a su inscripción ante el CNE fue la ausencia de la palabra "Camino" muy común de sus discursos anteriores y parte central de su mensaje de campaña.

    Veinte palabras más frecuentes

    Discurso de lanzamiento de candidatura

    Discurso después de la victoria en las Primarias de la MUD

    Discurso antes de la inscripción en el CNE

    Combinando las Encuestas - Entrega 5. Por: Iñaki Sagarzazu

    Por: Iñaki Sagarzazu

    En Twitter: @YVpolis

    http://yvpolis.blogspot.com

    Ya termina el último mes de la pre-campaña hacia las elecciones presidenciales -dado que en Junio se inscriben las candidaturas y sabremos oficialmente que caras veremos en el tarjetón en Octubre-. Aprovecho entonces para hacer una vez más mi análisis de la evolución de los sondeos de opinión pública de cara a estas presidenciales. Para este momento ya cuento con 62 encuestas de más de 10 encuestadoras que dan números sumamente disímiles cosa que hace este ejercicio aún más interesante.

    Voy a resumir mis hallazgos para aquellos que quieren que vaya al grano:

    - Actualmente la tendencia de las encuestas indica que el Presidente Chávez tiene cerca del 54% de intención de voto, mientras que el candidato de la oposición Henrique Capriles Radonski tiene cerca de 46%.

    - Sin embargo, el error de 5% hace que esta diferencia NO sea diferente de cero. Es decir hay un EMPATE TECNICO.

    - De las más de diez (10) encuestadoras solo tres (3) están haciendo estimaciones apegadas a la realidad. El resto tienen o sesgos oficialistas o sesgos opositores.

    Figura 1

    Como se puede observar en la figura anterior (figura 1) el promedio de las encuestas (obtenido igual que en la entrega número 4) ha tenido cierta variación desde principios de 2011. Sin embargo, a pesar de que existen periodos en los que uno de los dos polos políticos se encuentra por encima en las preferencias del electorado los periodos en los que estas diferencias son “estadísticamente significativas” (es decir hay espacios blancos!) son pocos. La mayor parte de los 17 meses transcurridos hasta ahora se encuentra en gris lo que significa que por más que una fuerza esté por encima existe un empate técnico. Ese es el punto en el que nos encontramos actualmente a días de comenzar oficialmente la carrera por Miraflores.

    Figura 2

    Cuando evaluamos que tan cerca o lejos están las diferentes casas encuestadoras de este valor promediado obtenemos los resultados de la figura 2. Estos resultados indican la existencia de sesgo pro-oficialista de cinco puntos en el caso de la encuestadora IVAD, de diez puntos en el caso de ICS y Consultores 30.11 y de 15 puntos en el caso de GISXXI. Observamos también la existencia de sesgo pro-opositor de 5 puntos en el caso de Consultores 21 y la encuestadora Keller y de 10 puntos de otras encuestadoras de reciente data (como Predicmatica). Finalmente solo tres encuestadoras reflejan números similares a los del análisis estadístico estas son: Datanalisis, Hinterlaces y Varianzas.

    Veremos cómo sigue esta evolución dentro de un par de meses, mientras tanto cada vez que veas una encuesta duda!

    lunes, 21 de mayo de 2012

    Como saber si una encuesta es confiable? – Parte 2

    Por: Iñaki Sagarzazu
    @YVpolis
    http://yvpolis.blogspot.com
    En ocasión anterior me referí a un análisis preliminar que estudiaba la existencia de sesgo en las encuestas electorales venezolanas (ver aquí). En base a una evaluación de elecciones anteriores, que incluía el referéndum revocatorio, las presidenciales del 2006, el referéndum del 2007 y las legislativas del 2010, argumenté que las encuestas donde existía menos sesgo eran aquellas que publicaban información relevante sobre la metodología utilizada (número de entrevistados, intervalos de confianza, método de contacto, etc.), sin embargo, también advertí sobre la existencia de un sesgo sistemático relacionado a las diferentes casas encuestadoras. Es decir, insinué sobre la existencia de unas encuestadoras cuyos productos presentaban altos índices de error con respecto a los resultados electorales.

    Debido al número relativamente bajo de encuestas analizadas, 35 en esa oportunidad, me limité a llamar la atención de la existencia de esta situación anómala en las encuestadoras venezolanas. En esta oportunidad he logrado aumentar el número de encuestas analizadas a 53 lo cual me permite llegar a conclusiones más sólidas –estadísticamente hablando-. Utilizaré este espacio entonces para presentar los hallazgos de este análisis cuya intención es ayudar en la evaluación más certera de las diferentes encuestas publicadas en nuestros procesos electorales. Antes de presentar el análisis quisiera recalcar la problemática existente que es la razón por la cual este estudio es necesario.

    El principio fundamental del método estadístico se basa en la hipótesis de que es posible hacer una predicción sobre una situación particular usando como origen una muestra aleatoria de la población a evaluar. Por ejemplo, si hay 100 pelotas en una bolsa y queremos saber el color de las pelotas podríamos hacer un pronóstico después de sacar 1, 2, 3 o 10 pelotas. En base al número de pelotas que saquemos y a la cantidad de diferentes colores podríamos generalizar sobre el total de 100 pelotas. En principio si se repite este experimento los resultados deberían ser relativamente similares.

    Este mismo principio de generalizar el color de las pelotas en base a una muestra es el que está detrás de una encuesta. En una esta se selecciona aleatoriamente un subgrupo de la población y se hace una predicción en base a lo que la muestra indica. Si 60 personas de 100 indican que votarán por el candidato A entonces se podría concluir que el 60% de la población votaría por A, con cierto grado de error. Igual que en el caso de las pelotas, si varias encuestadoras realizan este ejercicio los resultados deberían ser similares estadísticamente. Sin embargo, ese no es el caso en Venezuela. Al observar una muestra de las encuestas que se han hecho públicas en los últimos meses sobre las elecciones presidenciales del 2012 podemos observar diferencias muy grandes entre diversas casas consultoras. Estas diferencias pueden llegar a ser de casi 30 puntos porcentuales –muy lejos de cualquier margen de error-.En base a esta situación cabe preguntarse: ¿qué genera esta diferencia?

    Cuando existen diferencias entre diversas encuestas las principales causas suelen ser diferencias en las fechas de campo, el número de participantes, la metodología de selección de participantes (aleatoria, por cuotas, etc.), la forma de contactar a los participantes (teléfono, personal, etc.). Una vez se descartan estos factores podemos inferir que las diferencias radican en las casas encuestadoras. Particularmente en la forma en que estas obtienen sus datos o los analizan. En general esto no representa un problema si es un incidente aislado, sin embargo, cuando el error esta presente en todas las encuestas de una misma encuestadora entonces podemos hablar dela presencia de un sesgo sistemático.

    Ante esta problemática considero oportuno la creación de un barómetro para medir encuestas y calificar encuestadoras en base a “zonas de confiabilidad”. Particularmente útil en este objetivo es el Encuestómetro de la fundación Liderazgo y Visión de Venezuela. Esta es una herramienta que nos permite evaluar la calidad de las diferentes encuestas que se hacen públicas. El Encuestómetro utiliza diez variables como requisito para determinar si una encuesta es confiable.



    1. Población definida
    2. Método de recolección de datos
    3. Método de muestreo
    4. Ente que paga por la encuesta
    5. Datos de la muestra (Número de entrevistados, Nivel de Confianza, Error)
    6. Ubicación Geográfica
    7. Cuestionario
    8. Porcentaje de Rechazo
    9. Fechas de campo
    10. Trayectoria de la Firma

    Basado en un modelo estadístico en el que se incluyen la mayoría de estas diez variables es posible obtener las desviaciones sistemáticas de cada casa encuestadora. Con este propósito se evaluó un total de 51 encuestas, determinando si cumplían o no cada uno de los requisitos y se estimó que tan grande fue la diferencia entre la encuesta y el resultado electoral, sin importar a que tendencia beneficiaba esta brecha. Es importante destacar que este análisis es únicamente de sesgo y no de la tendencia de ese sesgo.

    Tabla 1
    La Tabla 1 muestra el promedio del error de las encuestas de cara a cuatro procesos electorales (el referéndum revocatorio, las presidenciales de 2006, el referéndum del 2007 y las elecciones de la Asamblea Nacional del 2010) así como sus valores mínimos y máximos para cada proceso electoral. Como se puede ver las encuestas previas al RR2004 son las que tuvieron -en promedio- un error más grande, seguidas por las encuestas previas al Referéndum del 2007. Sin embargo, a pesar de que los errores promedio están en el rango de los 5 puntos porcentuales, hay encuestas con errores de hasta casi 15 puntos.
    Al realizar el análisis estadístico los resultados muestran varias conclusiones interesantes.
    • En promedio, las encuestas que no publican ningún tipo de información tienen una diferencia de casi 20 puntos porcentuales entre la predicción y el resultado de la elección.
    • De los diez indicadores 3 son particularmente útiles en ayudarnos a determinar la confiabilidad de una encuesta, estos son:
    1. que se reporten datos de la encuesta como el número de encuestados (indicador 5)
    2. que se reporten las técnicas de muestreo (indicador 3)
    3. que se reporten las fechas de campo (indicador 9).
    • Los otros 7 indicadores parecen no tener influencia en la desviación. Esto no es indicativo de que no son importantes, pues por el contrario puede deberse a que son indicadores altamente reportados y con poca o ninguna variación (indicadores 2 y 4), son aquellos que nadie reporta (indicador 8), o son difíciles de evaluar (indicador 10).
    • Finalmente, se muestra la presencia de desviaciones sistemáticas presentes en las encuestas de diferentes encuestadoras. Por ejemplo, las casas encuestadoras poco conocidas tienen un promedio de error de 20% entre la predicción y el resultado de la elección.

    Este último resultado corrobora los hallazgos del análisis reportado en oportunidad anterior. En base a estos resultados de desviaciones sistemáticas propongo la utilización de un índice de confiabilidad. Este índice permite clasificar a las encuestadoras en base a tres zonas de riesgo:
    • Zona 1: Aquellas encuestadoras cuyo sesgo sistemático no pasa de los cinco (5) puntos porcentuales;
    • Zona 2: Aquellas encuestadoras cuyo sesgo se encuentra entre los cinco (5) y diez (10) puntos porcentuales;
    • Zona 3: Aquellas encuestadoras cuyo sesgo es mayor a los diez (10) puntos porcentuales.


    La figura 1 muestra la estimación de sesgo para cada casa encuestadora y la zona de confiabilidad en donde se ubican. Podemos ver, por ejemplo, que las encuestadoras Hinterlaces, Keller y Varianzas son las tres menos sesgadas. Mientras que GISXXI y otras encuestadoras menores (como por ejemplo Consultores 30.11) son las encuestadoras que cuentan con un mayor sesgo sistemático.


    Figura 1


    En conclusión, a pesar de que las encuestas deben capturar las tendencias en momentos específicos de la realidad política se da el caso que varias casas encuestadoras muestran estimaciones muy diferentes realizadas en el mismo periodo de tiempo. Aunque esta situación no debería ser estadísticamente posible, la realidad es distinta y a medida que nos adentramos en procesos electorales la necesidad de parecer ganador fomenta el uso y abuso de estas encuestas contribuyendo al clima de polarización e inestabilidad. Personalmente considero que esto va en detrimento de una competencia electoral sana en donde la confianza en la transparencia del proceso electoral es necesaria. Cuando existen encuestas muy disimiles siempre habrá quien argumente que hubo fraude luego de la elección sin importar los pasos que se lleven adelante para garantizar el resultado electoral. Este análisis muestra que es posible estimar que tan confiables pueden ser las diferentes encuestas en base a diferentes indicadores utilizando procesos electorales pasados como referencia.


    Basados en este análisis podemos revisar las predicciones de estas encuestadoras de cara a la elección presidencial 2012. La figura 2 muestra el promedio de la intención de voto reportado tanto para Chávez como para Capriles-Radonski (es importante mencionar que la mayoría de las encuestas usadas aquí son previas a las primarias y por lo tanto en base a un candidato opositor genérico). Como se puede observar las encuestadoras de la zona 1 dan un escenario promedio de 55-45, las encuestas de la zona 2 dan un escenario más cerrado de 51-49 y finalmente las encuestas de la zona 3 dan un escenario de 70-30. A partir de mañana mostraré las tendencias por zona con unos números interesantes.

    Saque usted sus conclusiones!

    Figura 2

    sábado, 31 de marzo de 2012

    Combinando las encuestas - entrega 4

    Por: Iñaki Sagarzazu
    @YVpolis
    http://yvpolis.blogspot.com

    El día de ayer, 29 de marzo, se hizo la convocatoria oficial para las elecciones presidenciales del 7 de Octubre de este año. Con este anuncio se cierra un mes muy activo en la política venezolana y particularmente en el posicionamiento de los dos candidatos principales a través de encuestas. Ayer hice un pequeño análisis de los números de las encuestas publicadas durante el mes de marzo y como se vería reflejado esto en términos de unas elecciones (ver aquí). Hoy, sin embargo, quiero retomar el análisis estadístico de las tendencias. No es la primera vez que hago esto ya que lo hice en Octubre y Noviembre del año pasado. Esta es así la cuarta entrega y como han pasado varios meses desde la última entrega tengo unas cuantas encuestas más para el análisis –sin embargo sigo creyendo que hay más encuestas que no logro conseguir-.

    Comienzo entonces diciendo que en esta oportunidad cuento con un total de 50 encuestas que comienzan en Enero del 2011. Estas encuestas han sido realizadas por 9 encuestadoras diferentes (3 de las cuales están agrupadas en una sola categoría porque sólo cuento con una o dos encuestas de cada una).


    Al final del post está la tabla con todas las encuestas incluidas los porcentajes de voto reportados para Hugo Chávez y para Henrique Capriles (es importante aclarar que casi todas las encuestas pre-primarias preguntaban por un candidato opositor genérico), las fechas de campo y el tamaño de la muestra (para saber si una encuesta es confiable pueden ver aquí o usar elencuestómetro).

    Después del análisis de todas las 50 encuestas es difícil decir que ha habido algún cambio en la tendencia: el presidente Chávez sigue arriba por una media de 10 puntos porcentuales pero –igual que en pasados análisis- el intervalo de confianza que permite decir si estos 10 puntos son reales (estadísticamente significativos) se acerca peligrosamente y la diferencia mínima es de 4 puntos porcentuales.

    Qué quiere decir todo esto? Que a pesar de que la mayoría de las encuestas dan una ligera ventaja al presidente Chávez el candidato de la oposición está lo suficientemente cerca como para pelearle la elección, sobre todo porque estamos todavía a 6 meses de las elecciones .

    En este momento, sin embargo, más interesante que ver los números que dan diferentes encuestadoras es ver como se comportan las encuestas según la casa encuestadora que las publica. Por qué digo esto? Porque, como reporté en mi artículo “Cómo saber si una encuesta esconfiable?” no todas las casas encuestadoras son iguales. Gracias a la técnica que utilizo para ver la tendencia promedio de las encuestas de diferentes encuestadoras (desarrollada y publicada por Simon Jackman en 2005, ver artículo) se puede obtener una medida de sesgo que es aportada por las casas encuestadoras. Es decir, si una encuestadora está consistentemente por encima, o por debajo, del promedio se puede decir que esta encuestadora está sesgada a favor, o en contra, de lo que se esté midiendo.

    Basados en esto y en el análisis realizado sobre las encuestas para las elecciones del 2012 podemos hacer las siguientes conclusiones temporales:
    1) La encuestadora GISXXI, IVAD y otras encuestadoras como Consultores 30.11, ICS y Contexto muestran un sesgo constante pro-Chávez.
    2)Las encuestadoras Consultores 21 y Keller, muestran un sesgo importante anti-Chávez.
    3) Las encuestadoras Datanalisis e Hinterlaces no muestran ningún sesgo significativo.

    Es importante destacar que este análisis es solo temporal puesto que para hacer una verdadera valoración sobre la existencia de sesgo es necesario que ocurran las elecciones. Mientras tanto solo hablamos de sesgo con respecto a un número estimado que puede llegar a ser real o no. De nuevo, cada quien que saque sus propias conclusiones...