Quelques commentaires sur les sondages électoraux

Whatsapp
Facebook
Twitter
Instagram
Telegram

Par OTAVIANO HELENE*

La prise en compte des données de différents organismes de recherche a l'avantage d'augmenter la quantité d'informations, mais augmente la fluctuation

Les enquêtes sur les préférences électorales de la population donnent des indications sur ce qui pourrait arriver si l'élection devait avoir lieu à ce moment-là. Cependant, afin d'évaluer les résultats de la recherche d'une manière plus générale, notamment en ce qui concerne les tendances possibles qu'ils peuvent révéler, certaines précautions doivent être prises. Illustrons cela sur la base des résultats des préférences des quatre principaux candidats aux sondages pour l'élection présidentielle effectués par diverses organisations au cours des mois de février à mars 2022, avant donc que le parti change, les définitions des listes et le regroupement des candidatures, quoique pas définitivement, ce qui s'est passé début avril.

Les données à analyser apparaissent sur la figure 1. L'ordonnée (axe y) de chacun des points de la figure 1 montre les préférences exprimées par les personnes consultées dans une enquête réalisée à la date correspondant à l'abscisse (axe x). Lorsque, dans une même enquête, plus d'un ensemble de candidats étaient considérés (généralement appelé scénario par les médias), les différents résultats étaient représentés sur la même abscisse.

Figure 1 – Résultats des scrutins électoraux ; candidats préférés.

Habituellement, les résultats des sondages sont présentés avec une estimation approximative de la « marge d'erreur », généralement de l'ordre de 2 % ou 3 %. Cette « marge d'erreur » signifie que, si l'enquête était réalisée le même jour, selon les mêmes modalités et s'adressant à des personnes ayant les mêmes profils (âge, sexe, éducation, revenu, zone géographique, religion, etc.), la les résultats pourraient être différents dans cette plage. Ces « marges d'erreur » n'ont qu'un caractère statistique, c'est-à-dire qu'elles n'incluent pas les incertitudes dues à la méthodologie adoptée ou aux hypothèses sur le profil de la population votante. De plus, ces marges sont valables pour les candidats ayant de bonnes préférences ; dans le cas des candidats ayant des taux de préférence inférieurs, les « marges d'erreur » sont plus faibles, comme nous le verrons plus loin.

Ainsi, des écarts inférieurs à la marge d'erreur entre deux sondages successifs réalisés par la même entreprise ne permettent pas de supposer qu'il y a eu, en toute sécurité et réellement, une variation de la préférence de l'électorat. Cette conclusion ne serait possible que si au moins une des conditions suivantes était remplie : la variation était supérieure à la « marge d'erreur » ; une variation dans le même sens se reproduit dans une nouvelle enquête réalisée par la même entreprise ; une variation équivalente s'est produite dans les sondages menés par une autre entreprise aux mêmes dates.

Ces 2 ou 3% habituels sont une estimation approximative de la marge d'erreur. Cette marge dépend, en effet, du degré de préférence du candidat. Par exemple, comme on peut le voir sur la figure 1, alors que les préférences maximales et minimales pour les deux candidats possibles les mieux notés (Lula et Bolsonaro) variaient, respectivement, dans une fourchette de 13 % et 12 % sur la période, les préférences pour les candidats Ciro et Moro variaient dans des fourchettes beaucoup plus petites, 5% et 4%, respectivement. Cette marge d'erreur, de l'ordre de 2% à 3%, est valable pour les candidats à forte préférence.

En règle générale, plus la préférence pour une candidature est proche de 50 %, plus cette « marge d'erreur » est importante. Ainsi, une variation de 3% de préférence pour une candidature, de 50% à 53%, par exemple, peut ne rien signifier, alors que la même variation dans une candidature mal notée, disons, de 5% à 8%, peut être assez importante .

Lors de la comparaison d'enquêtes menées par différentes entreprises, les plages (« marges d'erreur ») peuvent être plus grandes, comme indiqué ci-dessous.

En plus des variations purement aléatoires, il peut également y avoir des différences de résultats dues à l'adoption de méthodologies et d'hypothèses différentes concernant le profil de la population qui votera (comment il se répartit selon les revenus, la scolarité, l'âge, la région du pays, etc. . .).

Par exemple, parmi les données présentées à la figure 1, il existe deux types de sondages : un en personne et un par téléphone. Les différences entre ces deux résultats sont assez importantes. Dans les sondages téléphoniques, le candidat Lula avait, en moyenne, environ 2 à 3 % de voix en moins que dans les sondages en personne. Quant au candidat qui apparaît en deuxième position, la situation est inversée, avec plus de votes lors des consultations téléphoniques que lors des consultations en face-à-face.

Des faits comme celui-ci doivent être pris en compte lors de la comparaison des résultats publiés par différentes sociétés de recherche.

Les données qui apparaissent dans la figure 1, publiées au cours des mois de février et mars, ne montrent aucune tendance dans les préférences pour les quatre candidats possibles au fil du temps. Si l'élection avait lieu pendant cette période et avec ces candidats inclus dans les sondages, les résultats indiqueraient un vote entre 39 et 42% pour Lula et entre 26 et 29% pour l'autre candidat. Quant aux suffrages valables, Lula en aurait entre 45 et 49 %.

Il faut dire que le fait que les données n'indiquent aucune preuve de variation significative sur les deux mois considérés n'est pas une preuve qu'il n'y a pas eu de variation : l'absence de preuve d'un effet n'est pas la preuve de son inexistence.

En plus des variations aléatoires typiques des processus d'échantillonnage et des différences entre les résultats obtenus par différentes sociétés de sondage en raison de méthodologies et d'hypothèses différentes sur les profils des électeurs, il existe un effet de corrélation entre les résultats qui peut conduire à des conclusions erronées.

Pour comprendre cela, supposons une situation qui n'a que deux candidats. Un millier de personnes sont interrogées et, disons, 600 disent préférer A et 400 préfèrent B : 60% et 40% respectivement. Quelques jours plus tard, dans la même rue, 1000 autres personnes sont interrogées (par la même entreprise, utilisant les mêmes méthodologies et hypothèses, etc.). Même s'il n'y avait pas de différence entre les préférences de l'électorat, le nombre de personnes qui disent préférer A peut être un peu supérieur ou un peu inférieur à 600 par hasard. Disons que c'est 630 (63%). Donc, forcément le nombre de personnes qui disent préférer le candidat B sera plus petit, 370 (37%). Cela pourrait donner l'impression que la préférence de l'électorat varie : la préférence pour l'une des candidatures augmente et, « confirmant ce changement de position de l'électorat », la préférence pour l'autre diminue ; la différence entre eux a augmenté de 6%, bien au-delà des marges d'erreur typiques.

Mais les données n'étayent pas cette conclusion, et la phrase entre guillemets ci-dessus est fausse. Le fait que B ait diminué, au lieu de "confirmer la tendance", reflète simplement le fait que la somme des pourcentages de préférences pour les deux candidatures est fixe, 100% : si l'une croît, l'autre forcément décroît.

Lorsqu'il y a plus de deux candidats, cet effet est moins marqué ; cependant, lorsque deux d'entre eux obtiennent une grande proportion du total des voix, comme dans le cas des données présentées à la figure 1, l'effet est significatif. Cet effet signifie que, bien que les préférences des deux principaux candidats aient varié dans une fourchette de 12% à 13%), la différence entre les préférences des deux a varié, dans la même période, de 22%.

Une combinaison de tous les effets décrits doit s'être produite dans la recherche au cours de la période considérée. Par exemple, dans la région en surbrillance à gauche de la figure 2, il semble que la candidature de Lula aurait chuté, et beaucoup, avec quasiment un renversement de position tout au long de la première quinzaine de février.

Cependant, ce fait peut n'être qu'une combinaison des effets considérés. Tout d'abord, des variations de l'ordre de 3 % de préférence apparente pour un candidat ne sont pas significatives. Deuxièmement, en raison de l'effet discuté ci-dessus, l'augmentation, par simple fluctuation aléatoire, du score de l'un de ces deux candidats les plus votés implique, très probablement, la diminution de l'autre, ce qui provoque des variations de l'écart de l'ordre du double. . de cette valeur, 6 %, peut ne pas être statistiquement significatif. Un troisième effet est le fait qu'à la fin de la période mise en évidence dans la figure 2, les enquêtes téléphoniques sont incluses ; les sondages téléphoniques ont donné, sur la période analysée, en moyenne, moins de voix pour Lula et plus pour Bolsonaro.

Par conséquent, les données ne permettent pas de conclure qu'il y a eu une variation systématique au cours de cette période.

Figure 2 – Identique à la figure 1, mais uniquement pour les deux candidats ayant les préférences les plus élevées. La région en surbrillance pourrait suggérer à tort une tendance : une baisse de la préférence pour une candidature et une croissance pour l'autre.

 

Conclusion

On peut analyser les résultats des sondages électoraux en ne s'intéressant qu'aux résultats présentés par une seule entreprise dans le temps, ce qui évite que les variations observées soient affectées par différentes hypothèses concernant le profil socio-économique de la population votante et les méthodologies adoptées (téléphone et face-à-face). face à face, par exemple). Cependant, cela limite la quantité d'informations que nous pouvons analyser.

La prise en compte des données de différents organismes de recherche a l'avantage d'augmenter la quantité d'informations, mais elle augmente la fluctuation en raison des différentes hypothèses et méthodologies adoptées.

Quelle que soit l'option d'analyse, il faut éviter les conclusions hâtives. Il est également important de rappeler que les préférences électorales varient lentement dans le temps, à moins que des faits ou des nouvelles très marquantes, vraies ou fausses, n'émergent.

*Otaviano Hélène est professeur principal à l'Institut de physique de l'USP.

 

notes


[1] Enquêtes réalisées par les agences suivantes : Quaest, Ipespe, Datafolha, Paraná Pesquisas, MDA, Ideia, Futura, PoderData, Gerp.

[2] Les dates correspondent à celles de la réalisation des enquêtes et non à celles de la publication des résultats.

[3] Cela ne signifie pas qu'il n'y a pas de variation dans les préférences des électeurs ; il n'y a tout simplement aucune preuve pour cela.

Voir tous les articles de

10 LES PLUS LUS AU COURS DES 7 DERNIERS JOURS

Umberto Eco – la bibliothèque du monde
De CARLOS EDUARDO ARAÚJO : Réflexions sur le film réalisé par Davide Ferrario.
Le complexe Arcadia de la littérature brésilienne
Par LUIS EUSTÁQUIO SOARES : Introduction de l'auteur au livre récemment publié
Chronique de Machado de Assis sur Tiradentes
Par FILIPE DE FREITAS GONÇALVES : Une analyse à la Machado de l’élévation des noms et de la signification républicaine
Le consensus néolibéral
Par GILBERTO MARINGONI : Il y a peu de chances que le gouvernement Lula adopte des bannières clairement de gauche au cours du reste de son mandat, après presque 30 mois d'options économiques néolibérales.
Dialectique et valeur chez Marx et les classiques du marxisme
Par JADIR ANTUNES : Présentation du livre récemment publié de Zaira Vieira
Gilmar Mendes et la « pejotização »
Par JORGE LUIZ SOUTO MAIOR : Le STF déterminera-t-il effectivement la fin du droit du travail et, par conséquent, de la justice du travail ?
L'éditorial d'Estadão
Par CARLOS EDUARDO MARTINS : La principale raison du bourbier idéologique dans lequel nous vivons n'est pas la présence d'une droite brésilienne réactive au changement ni la montée du fascisme, mais la décision de la social-démocratie du PT de s'adapter aux structures du pouvoir.
Incel – corps et capitalisme virtuel
Par FÁTIMA VICENTE et TALES AB´SÁBER : Conférence de Fátima Vicente commentée par Tales Ab´Sáber
Le Brésil, dernier bastion de l’ordre ancien ?
Par CICERO ARAUJO : Le néolibéralisme devient obsolète, mais il parasite (et paralyse) toujours le champ démocratique
Le sens du travail – 25 ans
Par RICARDO ANTUNES : Introduction de l'auteur à la nouvelle édition du livre, récemment parue
Voir tous les articles de

CHERCHER

Recherche

SUJETS

NOUVELLES PUBLICATIONS