Présidentielles 2017 : quand les agences de #compol maltraitent la data

La data et le big data est le nouvel Eldorado des agences de com et de marketing. Très à la mode, l’idée est de proposer l’analyse d’un volume quantitatif d’informations pour en tirer une analyse qualitative. Synthétisé sous forme d’infographie, le résultat est souvent attirant. Mais attention aux approximations, qui peuvent avoir des conséquences fâcheuses d’interprétation. Surtout lorsque le thème traité est lié à l’élection présidentielle de 2017.

Lors de ma veille Twitter, je tombe sur une infographie d’une agence de communication politique (compol). Basée sur une analyse des comptes Twitter des 5 principaux candidats, elle propose le volume chiffré des faux comptes de leurs followers (chiffres arrêtés au 8 février 2017). Intitulée « les fake followers : qui est le moins mauvais ? », cette étude est mise en avant sur le compte Twitter de l’agence avec l’accroche un peu racoleuse suivante : « qui sont les champions de l’achat de #fakefollowers ? ». Et une promesse : celle de « décrypter réellement les comptes des candidats ».

2017-02-fakefollowers-00-wefluence-01L’agence définit comme faux comptes des comptes inactifs depuis plus de 3 mois et/ou « fake ». En annexe, une mention méthodologique : « un compte Twitter est considéré non captif si il n’y a pas de biographie et/ou s’il n’a pas tweeté depuis 3 mois ou plus ». Un peu léger, à mon sens. Mais ce n’est pas l’avis d’un membre de l’agence, qui m’explique que c’est la référence, qui est la même pour tous. Ah. Mais que cette référence, qui est la même pour tous, a été définie par l’agence elle-même. Encore mieux.

2017-02-fakefollowers-06-conversation_1Intrigué, je suis allé confronter les chiffres de l’étude à un outils en ligne qui propose aussi de mesurer la qualité des followers d’un compte twitter : Fakers, de Status People. Comme TwitterAudit, Fakers base son calcul sur l’analyse d’un échantillon, et propose dans ses résultats une catégorisation en trois niveaux : les vrais comptes, les comptes douteux ou inactifs, et les comptes fake.

Voyons le résultat :

Rappel étude WeFluence pour Emmanuel Macron :
30,3% de vrais comptes / 69,7% de fake

2017-02-fakefollowers-02-macron

Rappel étude WeFluence pour Benoit Hamon :
29,8% de vrais comptes / 70,2% de fake

2017-02-fakefollowers-01-hamon

Rappel étude WeFluence pour François Fillon :
21,9% de vrais comptes / 78,1% de fake

2017-02-fakefollowers-03-fillon

Rappel étude WeFluence pour Jean-Luc Mélenchon :
12,9% de vrais comptes / 87,1% de fake

2017-02-fakefollowers-04-melenchon

Rappel étude WeFluence pour Marine Le Pen :
12,6% de vrais comptes / 87,4% de fake

2017-02-fakefollowers-05-mlp

Les leçons à tirer de cette étude :

1) On a trouvé pire que les sondages

On a dit sur ce blog tout le mal que l’on pensait des sondages, aux nombreuses errances prophétiques, et dont la marge d’erreur est souvent bien camouflée. Une belle infographie n’a pas plus de réelle valeur informative, au final, quand on ne travaille que sur un échantillon et que l’on ne tient pas forcément compte des différents types d’utilisateurs de Twitter. La divergence des résultats comparés le prouve aisément.

La méthodologie de l’étude étudiée ici considèrerait donc l’ex-compte du député-maire Michel Vergnier comme un fake, alors qu’il s’agissait bien – avant qu’il soit hacké – d’un compte personnel, malgré son activité réduite en dehors des périodes de campagne électorale. Par ailleurs, je connais aussi plusieurs personnes qui ont un compte Twitter mais qui ne font que de la veille, sans publier quoi que ce soit.

2) Le risque démagogique

L’autre problème – danger, même – vient de l’accroche de présentation de cette étude dans le tweet de l’agence : « qui sont les champions de l’achat de #fakefollowers ». Avec les résultats proposés oscillant entre 69,7% (Macron) et 87,4% (Le Pen), le sentiment de politiciens menteurs est largement entretenu, au profit du complotiste « tous pourris ». On en connait les conséquences : montée du vote extrême et/ou abstention marquée.

Approximations méthodologiques, lecture potentiellement populiste de résultats simplistes… La quête de clients mérite-t-elle de prendre de tels risques démocratiques ? Espérons que les choses s’amélioreront d’elles-même…

NB : en addenda, les résultats de TwitterAudit

2017-02-fakefollowers-04-melenchon-twitteraudit 2017-02-fakefollowers-03-fillon-twitteraudit 2017-02-fakefollowers-05-mlp-twitteraudit 2017-02-fakefollowers-01-hamon-twitteraudit 2017-02-fakefollowers-02-macron-twitteraudit

Advertisements

2 réflexions sur “Présidentielles 2017 : quand les agences de #compol maltraitent la data

  1. Je comprend pas trop, on à un outils qui nous dit que EM est le moins mauvais et MLP et JLM les pire.
    Un autre outils nous dit au contraire que JLM à le meilleurs taux et EM le pire.
    Et un dernier outil qui nous place EM et MLP au coude à coude dans le haut du tableau …. en gros c’est du pifomètre tout ça ?

    • C’est en tout cas mon avis, oui. Des agences qui pêchent les clients avec du vent. Le postulat de ce qu’est un compte fake est plus que discutable, dans le cas présent, et une jolie infographie ne rattrapera pas un résultat qui ne voudra rien dire…

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s