Racolage, définition :
- Familier. Action d’attirer les gens à soi par des procédés en général peu scrupuleux : Se livrer à un racolage sur la voie publique.
- Action pour une prostituée de racoler un client sur la voie publique.
- Recrutement par surprise ou par force des hommes pour le service militaire. (Le racolage disparut avec l’établissement de la conscription.)
« 8% des français sont musulmans mais les français pensent qu’ils sont 31%. Tout est dit. »
La caractère racoleur du message ne m’a bien sûr pas échappé, mais je fus incapable de pousser le vice jusqu’au clic, l’article derrière ce Tweet reste pour moi un inconnu. Et qu’importe.
Qu’importe car c’est la construction même du message qui m’a mis mal à l’aise. D’une statistique grossière une information est créée, relayée et participe de la construction d’un abominable discours raciste. En outre, il aurait sûrement été utile de préciser que si 8 % des Français sont musulmans, en moyenne les Français pensent qu’ils sont 31 %. Sans quoi on jugera facilement que tous les français sont d’affreux xénophobes gavés par quelques médias peu scrupuleux qui sur-médiatisent une « minorité » à des fins politiques.
Faire parler les statistiques est malheureusement devenu un sport apprivoisé par d’obscurs curateurs aux velléités populistes. Si toutefois le populisme relève d’une statistique quelconque. Je ne m’attarde pas non plus sur le fait qu’il est, en France, interdit de collecter ou de traiter des données à caractère personnel qui font apparaître directement ou indirectement les opinions politiques, philosophiques et religieuses depuis 1872.
On peut néanmoins considérer que ce fameux 31% vaut ce qu’il vaut. Il émane sans doute d’une enquête sur un « échantillon représentatif » de français. Cet « échantillon représentatif » est pourtant intrinsèquement biaisé puisqu’il il dépend de plusieurs critères de sélection préalables à sa constitution :
- Il ne concerne que les gens qui ont un téléphone
- Il ne concerne que les gens qui parlent français
- Il ne concerne que les gens qui ont été disponibles au moment de l’appel
- Il ne concerne que les gens qui ont accepté de répondre à une enquête au lieu de raccrocher
- Il ne concerne que les gens qui ont accepté de répondre précisément à cette question
- etc.
A cet égard, nous pourrions considérer que puisque l’enquête remonte les avis de gens disponibles lors d’horaires ouverts, alors l’échantillon a des chances d’être majoritairement composé de chômeurs ou de personnes âgées. Nous pourrions également considérer que le simple fait d’accepter de répondre à une question aussi marquée idéologiquement dénote un manque certain d’esprit critique. Auquel cas nous aurions déjà affaire à une population portée sur les a priori, les clichés et peu encline à percevoir le vrai du faux en dehors du pur cadre émotionnel.
Et c’est d’ailleurs bien connu : les vieux sont réactionnaires et les chômeurs en ont marre de se faire piquer leurs emplois par des immigrés, des roms, des musulmans et des robots. Sans compter qu’ils sont les seuls à pouvoir reconnaître un musulman d’un non musulman d’un coup d’oeil (la musulmanie d’un individu est détectable à 30 mètres, c’est bien ça ?).
Bref, l’échantillon mériterait une étude à lui seul, pour qui veut s’en donner la peine. Mais le seul vrai point important ici est de comprendre que le simple fait de révéler cette statistique est un acte militant, peu importe son degré de véracité.
Nourrir un discours avec des données
Après avoir enfoncé cette jolie porte ouverte, je me suis autorisé une petite conversation avec de fins connaisseurs du monde des statistiques (toute proportion gardée, hein). Dès lors, il m’a paru pertinent de déconstruire les processus numériques et mentaux qui usurpent les données.
Pour ce faire, le site opendata.paris.fr m’a été très utile. Opendata répertorie des données publiques libres de droit et utilisable à des fins scientifiques. Rien de folichon jusque là, l’INSEE recèle déjà d’une masse d’information impressionnante.
La particularité d’Opendata est son degré de finesse. En effet, les champs de recherche du site permet de récupérer des données aussi précises que variées, comme le nombre d’arbres par arrondissements, la liste des cafés à un Euro, les titres les plus cherchés dans les bibliothèques ou encore les lieux de tournage de films à Paris.
A partir de là, tout devient possible, y compris jouer à l’apprenti sorcier en croisant des données au hasard. Ainsi, on peut facilement déduire que tel arrondissement est moins vert car ses habitants empruntent plus de bande-dessinées à la bibliothèque.
Évidemment, « corrélation » n’est pas « causalité » et la plupart des raccourcis peuvent être détectés sans trop de mal. L’argumentation qu’ils sous-tendent explose souvent en plein vol avant d’avoir pu percuter nos esprits. Flop.
Pour autant, ces douteux syllogismes qui n’ont aucune validité scientifique sont légion dans les médias, sur les réseaux sociaux, dans nos bouches, tous les jours.
Jouons avec les données de la ville de Paris
La mine de données d’Opendata Paris nous ouvrent toutes les voies de l’absurde. Voyons plutôt comment des rapprochements biscornus de données éparses peuvent accoucher de statistiques grotesques, mais bien réelles.
En fouinant un peu sur Opendata, on trouve des données publiques vraiment intéressantes. Par exemple, sont répertoriés les tonnages de déchets collectés par arrondissement et par mois. On remarque d’ailleurs qu’au cours de l’été, ce tonnage diminue substantivement dans certains arrondissements, et moins dans d’autres.
En recoupant cette première information avec la richesse relative par arrondissements (moyenne des montants des impôts payés annuellement par les foyers fiscaux de chaque arrondissement), on constate que dans les quartiers les plus riches, la baisse du tonnage de déchets des poubelles jaunes est plus forte pendant l’été.
Pour faire simple : les riches jettent moins de verre l’été. On pourrait en déduire qu’ils boivent moins de liquide contenu dans des bouteilles de verre, cependant cette différence de ratio n’existe pas vraiment pour les autres mois, donc nous pouvons l’exclure. En revanche, on peut arriver sans peine aux conclusions suivantes :
- « Les poubelles des riches sont vides l’été car eux, peuvent partir en vacances. »
- « Les riches boivent moins en été. »
- « Plus on paie d’impôt, moins on aime le plastique quand il fait chaud. »
- etc.
Je n’ai évidemment aucun élément qui confirme ces affirmations, elles ne sont que pure spéculation. Peut-être que les épiciers partent en vacances plus souvent dans les quartiers et obligent leur clientèle à se rabattre sur d’autres magasins. Allez savoir.
La donnée fait dans l’esbroufe
Pour valider les données statistiques exposées ci-dessus, il faudrait comprendre tous les critères qui ont contribué à leur érection en tant que données. Cet exercice d’affinement requiert une connaissance en profondeur des imbrications historiques qui ont pu avoir des impacts sur lesdites données dans une période de temps suffisante. Histoire, sociologie, mathématiques peuvent ainsi commencer à dessiner une forme de vérité s’exprimant en nombres et en pourcentages.
Les syllogismes imbéciles qu’on voit partout sur la toile méritent sincèrement d’être déconstruits, je ne vous parlerai pas de cette photo qui circule depuis quelques mois sur le réseau social professionnel LinkedIn et qui invente une corrélation entre le nombre de pages du code du travail et le taux de chômage…
Dans un cas comme dans l’autre, une recherche un peu approfondie qui « relève » la donnée autorise une interprétation beaucoup plus proche de la réalité, du vrai. La donnée ne s’exprime pas « en soi », elle a besoin d’une couche d’intelligence. En revanche, comme expliqué précédemment, elle reste politique, le simple choix ou non choix de présenter un chiffre est un acte militant.
Il est très facile de dire n’importe quoi (et je sais de quoi je parle)
Désormais, c’est le règne Big Data. Couplées aux données statistiques existantes, les innombrables sources publiques qui s’ouvrent à grandes eaux vont pouvoir constituer un précieux ensemble de ressources pour compter, mesurer, ordonner, comparer.
La donnée va devenir un levier politique redoutable, un outil de pouvoir et potentiellement : un appareil indispensable pour approcher une forme de vérité. On entend souvent que sans données, une opinion n’est qu’un avis supplémentaire. En forçant le trait, on pourrait considérer qu’une idéologie, qu’un programme politique ne revêt aucun caractère cohérent sans une analyse Big Data en amont. De quoi annihiler des pensées toutes entières.
Bref, peut-être qu’une majorité de français pense, en effet, que les musulmans sont plus nombreux qu’ils ne le sont en France et que je me refuse d’y croire. Peut-être aussi qu’il s’agit d’une opinion performative, d’une croyance collective qui existe justement parce qu’on s’en-tête à créer des sondages racoleurs dans un climat médiatique nourri de haine et obsédé par son audience, ses clics.
Enfin, il faut peut être que je fasse un sérieux tri dans les personnes que je suis sur Twitter.
Pour finir :
Je vous laisse avec ce site Internet qui répertorie des tas de corrélations douteuses. Je vous encourage également à visionner cette vidéo du génialissime e-penser découverte pendant ma petite rédaction, il explique tout ça bien mieux que moi.
[…] Opérateur du lien social ? […]