TORONTO — Elle a prédit avec précision l’issue du vote sur le Brexit, le résultat de la présidentielle américaine de 2016 et celui des élections fédérales de l’année dernière au Canada.
Et maintenant, un système d’intelligence artificielle conçu au Canada, appelé Polly, fait ses prédictions sur l’élection présidentielle américaine du mois prochain, en utilisant des données et des algorithmes provenant de médias sociaux publics.
Polly est présentée dans le nouveau documentaire «Margin of Error», qui sera diffusé en première samedi à la télévision publique ontarienne TVO, et partout au Canada sur tvo.org et sur la chaîne YouTube de la station.
Peter Gombos, de Toronto, a écrit et réalisé le documentaire, qui se penche sur l’utilisation des formes d’intelligence artificielle comme Polly pour aider à résoudre les problèmes des méthodes traditionnelles de sondage à l’ère numérique.
Le film présente le créateur de Polly, Advanced Symbolics Inc. (ASI), une jeune société d’étude de marché d’Ottawa. On peut consulter les prédictions présidentielles américaines de Polly sur le site internet de l’entreprise: advancedsymbolics.com/us-election/.
Les prédictions sont mises à jour quotidiennement et comportent pour l’instant une marge d’erreur élevée, qui rétrécira à l’approche des élections du 3 novembre. Mercredi après-midi, Polly accordait 346 votes du collège électoral au candidat démocrate Joe Biden, contre 192 au républicain Donald Trump. Polly accorde par ailleurs 55 % du vote populaire à Joe Biden et 45 % à Donald Trump.
«Mais bien sûr, l’énorme mise en garde à cet égard, en particulier aux États-Unis, concerne les questions de participation électorale, de suppression du vote, de vote anticipé et de rejet des bulletins de vote», a souligné M. Gombos lors d’un entretien téléphonique.
«Il y a tellement d’États pivots aux États-Unis, et les pourcentages dans les États pivots sont très proches, dans les marges d’erreur, comme 50-50 ou 51-49, plus ou moins 3 %. Donc tout dépend de la participation électorale.»
Imaginée par des chercheurs de l’Université d’Ottawa, Polly (une abréviation de «politique») est utilisée par ASI pour prévoir les attitudes des consommateurs, et n’est sous-traitée à aucune autre entreprise. Pour les prévisions électorales, elle examine les comportements et les modèles macro parmi les utilisateurs des médias sociaux qui parlent d’un parti politique ou d’un sujet, plutôt que les sentiments qu’ils expriment.
«Margin of Error», produit par Tom Powers, a suivi l’équipe d’ASI lorsqu’elle a utilisé Polly pour prévoir l’issue des élections fédérales canadiennes de 2019. Elle avait donné 155 sièges aux libéraux et 118 aux conservateurs, ce qui était très près du résultat réel: 157 sièges pour les libéraux et 121 pour les conservateurs.
Les sondages à l’ère numérique
ASI affirme que Polly a également fait des prédictions précises sur plusieurs autres scrutins très médiatisés, notamment le Brexit et l’élection de 2016 aux États-Unis, pour lesquels les méthodes traditionnelles de sondage par téléphone et de porte à porte, vieilles de près d’un siècle, ont raté la cible.
«Autrefois, c’était très facile», affirme M. Gombos au sujet des sondages traditionnels, qui mènent des enquêtes auprès d’un petit groupe d’une population sélectionnée au hasard pour représenter l’ensemble plus large et prédire les opinions de l’ensemble de la population.
«Les gens étaient enthousiastes, ils ne claquaient pas leur porte ou ne raccrochaient pas leur téléphone, et ils répondaient. Et en général, les sondeurs disent que c’était une prédiction très simple, et c’était assez précis. Mais la démographie du Canada, par exemple, a changé au cours des 40 dernières années, les technologies sont devenues de plus en plus mobiles et les gens sont devenus agacés de répondre à des questions.»
Alors que les sondages capturent une tranche de temps à partir d’un échantillon représentatif de 1000 personnes, par exemple, l’intelligence artificielle peut parcourir à la minute près les opinions et les comportements de centaines de milliers d’utilisateurs de médias sociaux sur une période plus longue et proposer des modèles qui peuvent ne pas être observés par le biais des sondages traditionnels, explique M. Gombos.
Polly obtient principalement ses données sur Twitter, et certains critiques se demandent si elle peut fournir avec précision un échantillon représentatif de l’ensemble, alors que la majorité des utilisateurs de cette plateforme sont jeunes, urbains et intéressés par la politique, souligne M. Gombos.
Mais ASI fait valoir que Polly suit les algorithmes de l’ensemble de Twitter pour identifier les utilisateurs qui reflètent les données démographiques de chaque circonscription, afin qu’elle puisse toujours trouver un moyen d’équilibrer l’échantillon représentatif, ajoute-t-il. Les algorithmes de Polly lui permettent apparemment d’écarter les comptes alimentés par des «robots».
Et s’ils ont inclus dans les calculs de Polly, «ces robots font partie d’une conversation plus large», précise le réalisateur. «La conversation doit donc s’élever à un certain niveau pour être prise en compte dans les prédictions de Polly.»