Nous avons fait les premières analyses de l'évolution des intentions de vote à partir de tous les sondages publiés depuis le 1 er janvier 2011. Voici les résultats:
1) Canada total:
- Très légère hausse pour le PC (,04 point par jour) et pour le NPD (,03 point par jour) associée à une très légère tendance à la baisse pour les Verts (-,04 point par jour).
- Ces estimations mettent le PC à 38,5%, le PLC à 26,6%, le NPD à 17,9%, le BQ à 9,8% et les Verts à 6,8%
- Différence significative entre les sondages Internet et les autres: au total, les sondages Internet ont évalué le PLC en moyenne 2,3 points plus bas que les autres sondages et le NPD, 2,08 points plus haut.
2) Ontario:
- Légère hausse de l'intention de vote pour le PC (,077 point par jour) ce qui donne quand même près de 7 points sur l'ensemble de la période. Baisse concurrente des Verts (,058 par jour). Aucune évolution significative pour les autres partis.
- Ces estimations mettent le PC à 42,9%, le PLC à 32,4%, le NPD à 17,3% et les Verts à 6,7%.
- Aucune différence entre les sondages Internet et les autres.
3) Québec:
- Légère hausse de l'intention de vote pour le PC (,047 points par jour). Aucune évolution significative pour les autres partis.- Ces estimations mettent le Bloc à 38,8%, le PC et le PLC à égalité (respectivement 20,3% et 19,5%), le NPD à 15,7% et les Verts à 5,5%.
- Les sondages Internet se distinguent en plaçant le NPD 3,95 points plus haut que les autres sondages, en moyenne, après contrôle pour l'évolution. En fait, si on contrôle pour l'effet des sondages Internet, l'intention de vote pour le NPD est en hausse. Si on n'en tient pas compte, elle est stable.
- Il faut souligner les écarts importants dans l'estimation de l'intention de vote pour le parti Libéral du Québec, particulièrement au cours de la dernière semaine (voir graphique).
Rectification: Suite à mon précédent blogue, Jaideep Mukerji de Angus Reid m'a informé que la firme effectue une pondération en fonction de la langue d'usage au Québec. Cette information était omise de la notice méthodologique mais elle devrait apparaître à l'avenir.
Au plaisir
Claire Durand
Bonjour Mme Durand,
RépondreEffacerUne question me vient sur vos présentations graphiques : y a-t-il une justification à choisir la ligne droite unique (plutôt que brisée) pour afficher l'intention de vote estimé? Il me semble que cela laisse entendre que tous les points de sondages (qui servent, j'imagine, au calcul de la pente de la droite) ont la même importance et le même poids pour l'estimation, qu'ils soient éloignés ou proches dans le temps.
Autrement dit, pourquoi les données de janvier ont la même importance que celle d'avril si c'est juin qu'on analyse? N'est-ce pas dans la nature de l'objet mesuré que d'être fluctuant? Pourquoi en faire une représentation linéaire?
Pour le moment, la représentation est linéaire parce que, de fait, il s'agit de la pente de la droite en fonction du temps. Lorsqu'il y a augmentation, c'est que le temps est significatif. On teste également d'autres modèles (temps au carré pour le moment, influence des événements, etc.). Ca se développera durant la campagne et éventuellement, on aura une représentation plus conforme à la réalité quand on aura assez de sondages pour faire des séries chronologiques.
RépondreEffacer@ Bertrand Lemire
RépondreEffacerPermettez moi de répondre.
C'est un calcul de la ligne (théorique) qui est la moyenne de toute la population de données, corrigée pour l'évolution dans le temps. Le nom formel, une régression linéaire. Ça permet de dégager les tendances précises en évacuant les aléas provoqués par les mesures multiples. C'est exactement le même procédé qui est utilisé en science pour dégager les tendances et faire fi du superflu.
C'est ce que l'on utilise en psychologie, en médecine, en métallurgie, en actuariat, etc. Enfin dans toutes les sciences où l'on cherche à dégager des tendances lourdes lors d'une évaluation d'une population de données.
Si vous allez sur Wikipedia, vous aurez une belle introduction sur les mesures statistiques et leurs avantages.
http://fr.wikipedia.org/wiki/Statistiques#La_d.C3.A9marche_statistique
Bonne lecture
Ho, désolé, Mme Durand n'avait pas répondu quand j'ai commencé ma réponse...
RépondreEffacer@ Nicolas
RépondreEffacerMerci de la réponse. Le sens de ma question n'était cependant pas d'obtenir une explication du calcul de la droite mais plutôt d'obtenir une justification à son utilisation dans les circonstances.
Ici, Mme Durand a fait trois choix :
1) Prendre toute la période (janvier à mai) comme un seul intervalle, plutôt que le scinder. (En réponse, Mme Durant a émis la possibilité de considérer éventuellement l'influence des événements, ce qui correspond un peu à scinder l'intervalle.)
2) Utiliser un modèle linéaire plutôt qu'un autre. (En réponse, elle a par contre annoncé que ce choix pourrait changer.)
3) Nommer la droite de tendance «Intention de vote estimée». Personnellement, je pense que ce nom est de mauvais aloi mais c'est un détail et je ne me repose sur rien, c'est donc une opinion qui n'intéresse que moi.
Ceci étant dit, je suis très heureux de ce blogue, qui aborde non les résultats mais la nature des sondages.
Bon, je ne suis pas encore très bonne pour suivre mon blog....
RépondreEffacerTrès bon commentaire de Nicolas, merci.
Pour ce qui est de la période choisie, elle dépend surtout du fait qu'il faut un nombre suffisant de sondages pour justifier de faire une régression. A mesure que la campagne va avancer, je vais essayer le plus possible d'en arriver à avoir seulement les sondages de la campagne ou à la rigueur commençant la semaine avant. Par ailleurs, il s'agit d'une droite parce que les effets quadratiques n'étaient pas significatifs. Encore là, il faut aussi avoir une période suffisamment longue. Demain, nouvelles analyses, peut-être avec des effets quandratiques.
au plaisir