dimanche 27 mars 2022

France 2022, mise à jour et 2ème tour

 Bonjour,

Les nouveaux sondages publiés au cours de la dernière semaine confirment la tendance constatée la semaine dernière. On a l'impression que les intentions de vote sont figées, quels que soient les candidats. Emmanuel Macron est en tête avec environ 30% des intentions de vote, stables depuis environ début mars, après une remontée mi-février. L'appui à Marine LePen a augmenté d'un ou deux points depuis janvier; il est stable à 19 %. Enfin, il est définitivement trop tard pour Mélenchon, qui stagne à environ 14%. Il lui faudrait un miracle -- du type de la vague orange survenue lors de l'élection de 2011 au Canada -- mais les conditions actuelles en France sont très différentes. On se dirige donc vers un duel Macron-Le Pen au deuxième tour.


Le deuxième graphique montre les intentions de vote au deuxième tour pour un tel duel. La hausse puis la stabilisation de l'appui à Emmanuel Macron se confirme également pour ces intentions de vote hypothétiques.


On peut se demander comment les partisans des autres candidats voteront au deuxième tour? Harris Interactive produit un tableau croisé de ces intentions de vote. Il montre (voir diapo 17) que la majorité des appuis aux autres candidats ira à Emmanuel Macron, à l'exception des appuis à Eric Zemmour qui iraient à Marine LePen. On trouve en outre une proportion variable de partisans des autres candidats qui déclarent vouloir s'abstenir, voter nul ou votre blanc.

Un dernier point sur les différences entre les instituts en fonction des sources de données. Les dernières analyses confirment celles que j'ai présentées dans mon précédent billet. Cluster17 continue à se distinguer des firmes utilisant des access panel par des estimations un peu différentes des appuis aux candidats plus extrêmes, soit plus bas pour Le Pen et plus élevés pour Mélenchon et Zemmour.

En conclusion

L'expérience m'a montré que la prédiction est dangereuse. Il reste que, cette fois-ci, je m'intéresserai surtout à voir si la prédiction des sondages se situe à l'intérieur des marges d'erreur et à voir l'impact de la source des données. La prédiction du gagnant ne semble pas faire de doute.


P.S. Du point de vue statistiques, j'ai modifié un paramètre de la régression locale (,50 plutôt que ,65 pour Epanechnikov) pour que les courbes tiennent mieux compte des estimations publiées depuis les deux dernières semaines.

lundi 21 mars 2022

France 2022, plus que 20 jours

 Bonjour,

 

Bonjour,

Voici quelques analyses sur les sondages du premier tour de la prochaine élection présidentielle française de 2022. Je présente d'abord l'évolution des intentions des intentions de vote depuis le début janvier, telles que mesurées par neuf instituts. Je regarde ensuite si des différences méthodologiques entre les divers instituts conduisent à des différences dans les estimations.

 Les intentions de vote globales

La figure 1 montre l'évolution récente des intentions de vote. Les points représentent les estimations des instituts. Ils sont situés au point milieu de la cueillette des données. Les lignes représentent l'estimation produite par régression locale. On constate que l'appui à Emmanuel Macron a fait un bond important, passant de 25% à plus de 30% entre la mi-février et la mi-mars. Toutefois, cette hausse semble s'être stabilisée au cours de la dernière semaine. En deuxième, l'appui à Marine Le Pen est stable depuis janvier, à environ 18%. Les trois autre candidats les plus importants -- Jean-Luc Mélenchon, Valérie Pécresse et Eric Zemmour -- sont pratiquement à égalité entre 10% et 13%. Toutefois, seul l'appui à Mélenchon a progressé depuis janvier alors que l'appui à Pécresse a fait une chute d'environ sept points et l'appui à Zemmour est retombé à son niveau de départ après une légère hausse en janvier.

On est donc loin de la situation de 2017 où quatre candidats -- Macron, Le Pen, Fillon et Mélenchon ont terminé avec entre 20 et 24 pourcent du vote. Par contre, en 2017, à un mois de l'élection, l'appui à Mélenchon était au même niveau que maintenant. Il avait fait des gains importants pendant le dernier mois aux dépens de Benoit Hamon.

 

 Quel impact des méthodologies des instituts?

Tous les instituts utilisent une pondération basée entre autres sur le ou les votes déclarés à l'élection présidentielle de 2017 et, dans un cas, aux élections régionales de 2021. Cette pratique entraîne une réduction de la variance dans les estimations, ce qui explique le peu d'écart entre les instituts. De plus tous les instituts administrent leurs sondages via internet. Ils se distinguent toutefois dans la source utilisée pour sélectionner leurs échantillons. Quatre firmes utilisent leur propre panel de volontaires, non probabiliste, appelé access panel en France. Deux firmes utilisent l'access panel de Bilendi. Enfin, une firme, Cluster17, utilise une source totalement différente, plus probabiliste. La Commission des sondages a émis un mise au point à l'encontre de cette firme, jugeant que la base de sondages n'était pas bien contrôlée par la firme. Or cette firme semble produire des estimations un peu différentes de celle des autres firmes pour certains candidats, du moins.

La question qui se pose est de savoir si les estimations des firmes se distinguent significativement en fonction de la source des données utilisées, si cette différence persistera pendant toute la campagne et au final, si certaines sources donneront une meilleure estimation des intentions de vote. La question est d'autant plus importante que la plupart sinon tous les sondages électoraux se font maintenant par internet dans plusieurs pays mais que des méthodologies différentes apparaissent pour ce qui est des sources d'échantillons.

Statistiquement, les sources de données de type acces panel, que ce soit les panels propriétaires ou le Panel Bilendi donnent des résultats similaires. Seul Cluster17 se distingue, surtout par une évaluation plus élevée pour Mélenchon et Zemmour et par une évaluation plus basse de l'appui à Le Pen. On n'est donc pas devant un cas de "biais idéologique" mais plutôt de différence dans l'estimation des extrêmes. Les instituts ne se distinguent pas par une estimation différente de l'appui à Macron et à Pécresse.

Cluster17 -- la ligne mauve -- donne une évaluation systématiquement plus élevée de l'appui à Mélenchon comme on peut le voir dans le graphique suivant. Par contre, la différence semble en voie de s'atténuer.



Pour ce qui est de LePen, Cluster17 produit une estimation légèrement plus basse. toutefois, contrairement à ce que l'on voit pour Mélenchon, il arrive que d'autres instituts aient des estimations similaires ou même plus basses que celles de Cluster17 -- comme on le voit par les points bleus qui représentent les estimations de sondage utilisant un acces panel.


Enfin, Cluster17 estime l'appui à Zemmour plus élevé que les autres instituts mais trace la même évolution dans le temps.

En résumé, la différence entre Cluster17 et les autres instituts existe, du moins pour le moment, pour trois des cinq principaux candidats. Elle semble se concentrer dans les extrêmes, de droite ou de gauche. Il faut se rappeler que l'appui à ce type de candidats -- rappelons entre autres Jean-Marie LePen en 2002 -- a longtemps été difficile à estimer en France comme ailleurs. Par ailleurs, les différences, quoique significatives, ne sont pas si importantes -- de deux à trois points de pourcentage en moyenne. L'avenir dira "qui a raison". 

Conclusion

Pour le moment, la situation semble assez claire. Tous les sondeurs "prédisent" un duel Macron-LePen au deuxième tour. Il faut toutefois se rappeler qu'il y avait eu un mouvement important vers Mélenchon durant le dernier mois de la campagne de 2017. Pour le moment, Mélenchon semble assez loin de LePen. L'appui aux trois candidats "éliminés" est très similaire mais seul Mélenchon est en progression. Donc, tout n'est pas encore joué définitivement.


Au plaisir