B.a.-ba des élections

par Marie Léger-St-Jean

Données, sondages et projections

Résultats des élections québécoises de 1998
Source: La Presse, 1 décembre 1998, p. A1. BAnQ numérique.

Il y a vingt ans, en 1998, le Parti québécois sous Lucien Bouchard obtenait moins de voix que le PLQ de Jean Charest, mais remportait haut la main l’élection avec 76 élus contre 48!

Pourquoi?! Parce que nous n’avons pas un mode de scrutin proportionnel ni au Québec ni au Canada. Nous avons plutôt un mode de scrutin uninominal à un tour hérité du Royaume-Uni. Le pourcentage des voix qu’obtient un parti à l’échelle nationale n’est donc pas du tout le même que le pourcentage de sièges qu’il emporte.

Ça ne paraissait même pas, le lendemain, sur la une du Devoir:

Titre du Devoir au lendemain des élections québécoises de 1998
Source: Le Devoir. 1 décembre 1998, p. A1. BAnQ numérique.

(À en juger par les résultats indiqués sur les unes, La Presse et Le Devoir n’avaient pas la même heure de tombée.)

Répartition du vote, sondages et projections

Les sondages mesurent les intentions de vote pour tenter de prédire le vote populaire. Comme notre mode de scrutin n’est pas proportionnel, les sondages, comme le vote populaire, n’indiquent pas le pourcentage de personnes qui siégeront à l’Assemblée nationale pour chaque parti.

C’est pourquoi depuis longtemps les sondeurs ventilent les intentions de vote selon la langue maternelle de l’électorat (francophone et non francophone ou francophone, anglophone et allophone).

Extrait du sondage de CROP de juin 1998 sur les intentions de vote des Québécois: ventilation selon la langue maternelle
Source: «Politique au Québec: perceptions des Québécois». CROP, juin 2018, p. 8.

Le vote non francophone étant plus concentré géographiquement (Ouest de Montréal, Outaouais, Estrie), il a moins de poids que le vote francophone.

Titre du Devoir au lendemain des élections québécoises de 1998
Source: Le Devoir. 16 novembre 1998, p. A1. BAnQ numérique.

En effet, il n’y a aucune différence entre remporter un siège dans un comté avec 90% des votes ou avec 35%. Il faut juste remporter plus de voix que la personne candidate qui arrive deuxième.

Voilà donc à quoi servent les projections: elles permettent de «traduire» les intentions de vote nationales en intentions de vote dans chaque circonscription pour calculer le nombre de sièges que remporterait chaque parti.

Projections

Depuis quelques années, des gens se sont attardés à bâtir des modèles de projections qui transforment les intentions de vote des sondages en nombre de sièges.

Il y a maintenant dix ans est apparu le site de projections ThreeHundredEight.com d’Éric Grenier, sous l’impulsion du FiveThirtyEight de Nate Silver aux États-Unis. Éric est depuis devenu employé à temps plein à la CBC et a fermé son site.

Three Hundred Eight banner
Source: Capture d’écran de http://www.threehundredeight.com/ effectuée le 22 août 2018.

Logo du site de projection électorale Qc125Too Close to Call / Si la tendance se maintient - logoToutefois, deux autres gars sont entretemps entrés dans la danse et offrent leurs propres modèles de projection: Bryan Breguet à Si la tendance se maintient (mieux connu sous le nom anglais du site, Too Close To Call), fondé en 2010, et Philippe J. Fournier, qui a créé Qc125 en 2017.

Toutes les projections de Bryan présentent quatre données pour chaque parti: une prévision du pourcentage du vote populaire, une prévision du nombre de sièges, un intervalle du nombre de sièges qu’obtient le parti dans ses simulations et le pourcentage de chances qu’un parti l’emporte.

Extrait du projection de Too Close to Call
Source: Breguet, Bryan. «Les meilleurs et pires scénarios pour chaque parti en ce début de campagne». Too Close To Call (blogue), 21 août 2018.

Philippe donne la même information mais à l’aide de visualisations (graphiques et schématisation des sièges de l’Assemblée nationale). Il donne des intervalles de confiance à la fois pour ses projections du vote populaire et des sièges.

Les projections permettent ainsi de rendre compte de l’incertitude des sondages. C’est un pan important du travail d’éducation populaire de Nate Silver aux États-Unis. Il s’agit d’agréger (rassembler) les différents sondeurs, de donner plus d’importance à ceux qui ont de plus grands échantillons et de tenir compte de la marge d’erreur.

Sondages

Les sondages indiquent les intentions de vote. Une intention de vote, c’est «si les élections avaient lieu aujourd’hui, je pense pas mal que je voterais pour la candidature du parti X».

Extrait d'un sondage Crop
Source: «Politique au Québec: perceptions des Québécois». CROP, juin 2018, p. 8.

C’est une intention, ce n’est pas le vote réel de la personne. Elle peut changer d’idée, ne pas aller voter finalement ou bien… mentir au sondeur!

Les maisons de sondage tentent d’échantillonner l’ensemble de la population de manière aléatoire. Avant, lorsque tout le monde avait une ligne fixe à la maison et presque tout le monde avait son numéro de téléphone dans un bottin (oui oui, les jeunes, il y avait une vie avant la venue des cellulaires), c’était beaucoup plus simple.

Les maisons de sondage s’adaptent depuis quelques années aux changements d’habitudes de communication de la population. Elles peuvent «acheter» des numéros de cellulaire pour agrandir le bassin des personnes rejoignables par téléphone.

Les maisons de sondage ont aussi développé de nouvelles méthodologies avec des panels Web. Ces échantillons ne sont pas choisis aléatoirement, mais ils sont pondérés pour représenter le poids effectif de chaque groupe démographique dans la population québécoise sur la base des données du recensement.

Incertitude

Malgré les représentations visuelles qui permettent de voir clairement que des résultats se chevauchent, il y en a quand même pour ignorer l’égalité statistique:

Extrait d'un tweet de Vincent Marissal (Québec solidaire) citant une projection électorale le mettant en égalité statistique à la première place dans Rosemont
Source: Vincent Marissal, Facebook.

Les modèles de Qc125 et de Too Close To Call, ce sont une série de règles qui disent comment traduire les données nationales dans chaque circonscription. Sauf que ce sont aussi des simulations.

Plutôt que de rentrer directement les chiffres des sondages dans un calculateur (une feuille Excel, par exemple), ils demandent à un ordinateur de générer aléatoirement des distributions qui correspondent à ce que donne les marges d’erreur des sondages. C’est comme ça qu’ils obtiennent leurs intervalles et les pourcentages de chances que chaque parti gagne.

Indécision et personnes discrètes

Ça, c’est l’incertitude statistique. Et l’incertitude humaine? L’indécision des électeurs et électrices qui n’ont pas la tête aux élections ou qui contemplent les choix offerts et désespèrent? C’est ce sur quoi ces modèles ne mettent pas l’accent parce qu’ils misent sur le problème qui turlupine les maisons de sondage depuis le début: la répartition des personnes indécises.

La répartition des personnes indécises sert à prédire le résultat d’une élection. En effet, on ne peut pas voter «Je ne sais pas». Le jour du scrutin, les personnes qui ont donné cette réponse dans un sondage voteront pour un parti ou pour un autre, se déplaceront pour annuler leur vote ou resteront à la maison.

En faisant la répartition des personnes indécises, les maisons de sondage et les projections essaient de deviner dans la catégorie dans laquelle tomberont les personnes indécises qui ont été sondées pour obtenir une prévision qui s’approchera le plus du résultat de l’élection.