Comment mentir avec les statistiques?

Pour mentir avec les statistiques, essayez d'utiliser des nombres anormalement élevés ou bas lorsque vous calculez la moyenne de quelque chose pour faire basculer les résultats. Par exemple, si 9 personnes ont 750€ de dollars, et que vous tenez compte d'une dixième personne qui n'a que 0,70€, le montant moyen dont dispose chaque membre du groupe est de 670€, même si presque tout le monde a plus que cela. Vous pouvez également mentir avec les statistiques en utilisant un petit ensemble de données. Par exemple, si vous interrogez 10000 personnes, vos résultats seront probablement exacts, mais si vous ne interrogez que 5 personnes, vos résultats seront probablement erronés. Pour apprendre à mentir à l'aide de graphiques statistiques, faites défiler vers le bas!

La moyenne médiane est le nombre dans un ensemble de données qui se situe à mi-chemin entre les nombres
La moyenne médiane est le nombre dans un ensemble de données qui se situe à mi-chemin entre les nombres inférieurs et les nombres supérieurs.

Comme le sait toute personne soucieuse du détail, les statistiques peuvent être très glissantes sans savoir comment les interpréter. Lisez les étapes ci-dessous pour apprendre à saisir des statistiques délicates et trompeuses et utiliser ces connaissances à votre avantage.

Méthode 1 sur 3: mentir avec des moyennes

  1. 1
    Comprendre la terminologie. Le mot «moyen» est souvent utilisé lorsque des données statistiques sont discutées. À première vue, le terme semble assez simple: la moyenne est le montant qui se situe à peu près au milieu. Cependant, il existe en fait peu de types différents de moyennes, qui peuvent toutes être trompeuses si elles ne sont pas correctement comprises.
    • La moyenne moyenne est atteinte en additionnant tous les nombres d'un ensemble de données et en les divisant par le nombre d'entrées dans l'ensemble. En d'autres termes, si vous avez les nombres 3, 3, 5, 4 et 7, la moyenne moyenne peut être atteinte en les additionnant (pour obtenir 22) puis en divisant la somme par 5 (puisqu'il y a 5 nombres dans le ensemble).
      • Dans cet exemple, la moyenne moyenne est de 4,4.
    • La moyenne médiane est le nombre dans un ensemble de données qui se situe à mi-chemin entre les nombres inférieurs et les nombres supérieurs. En utilisant les mêmes données que précédemment (3, 3, 5, 4 et 7), la moyenne médiane est de 4, puisque 2 des nombres sont inférieurs et 2 sont supérieurs.
    • La moyenne de mode est une représentation du nombre le plus courant dans l'ensemble de données. En utilisant notre jeu d'exemples, la moyenne du mode est 3, puisqu'elle apparaît deux fois.
  2. 2
    Mensonge avec des moyennes moyennes. La moyenne moyenne peut sembler la plus infaillible de toutes les méthodes décrites ci-dessus, mais ce n'est en fait pas le cas. En effet, des nombres anormalement élevés ou faibles dans l'ensemble de données peuvent faire varier considérablement la moyenne. Pour mentir avec une moyenne moyenne, rassemblez des données aberrantes et utilisez-les dans votre équation.
    • Par exemple, imaginez que vous interrogez 50 ménages d'un quartier sur leurs revenus. La plupart des ménages gagnent entre 29900€ et 44800€ par an, mais un ménage gagne 3,70 millions d'euros par an. Lorsque vous calculez la moyenne moyenne, le nombre sera nettement plus élevé que le revenu moyen "réel" dans ce domaine, car le nombre de 3,70 millions d'euros est beaucoup plus grand que les autres.
    • De la même manière, si vous aviez des données montrant que 9 personnes avaient chacune 750€ sur leur compte bancaire, mais qu'une dixième personne n'a que 0,70€, la moyenne médiane s'établirait à 670€ - près de 10% de moins que la plupart montant commun.
    • Des enquêtes réputées rejettent souvent les chiffres les plus élevés et les plus bas avant de calculer la moyenne moyenne. Cependant, tous les sondages que vous voyez dans les actualités ne sont pas dignes de confiance. À moins que vous n'ayez vous-même accès à l'ensemble des données ou que vous ne voyiez une assurance écrite que les valeurs aberrantes ont été supprimées, il est plus sûr de supposer qu'elles ne l'ont pas été.
  3. 3
    Mensonge avec des moyennes médianes. La moyenne médiane est en fait le nombre le plus difficile à "mentir", car elle ne peut jamais être trop élevée ou trop basse par rapport à la plupart des ensembles de données. Il doit se trouver au centre par nécessité. Cependant, vous pouvez utiliser la moyenne médiane pour masquer un nombre très grand ou petit. Par exemple, si votre ensemble de données est 1, 1, 2, 3, 4, 5, 3000, la moyenne médiane est 3.
    • Lorsque vous avez un nombre pair d'entrées, vous pouvez atteindre la moyenne médiane en trouvant la moyenne des deux entrées au milieu. Cela ne tient toujours pas compte des valeurs aberrantes.
    • Méfiez-vous des moyennes médianes utilisées pour décrire les changements au fil du temps. Une entreprise qui augmente le prix de ses services de 3% chaque année pourrait les augmenter de 20% cette année et le cacher en présentant une moyenne médiane de 3% sur les 9 dernières années.
    La moyenne de mode est une représentation du nombre le plus courant dans l'ensemble de données
    La moyenne de mode est une représentation du nombre le plus courant dans l'ensemble de données.
  4. 4
    Mensonge avec les moyennes de mode. Dans certaines choses, les moyennes des modes sont presque impossibles à déterminer - le nombre moyen de billets achetés par personne pour un jeu de balle, par exemple, sera presque toujours reflété avec précision par le mode. Néanmoins, les moyennes de mode peuvent également exclure des données importantes, en particulier dans les ensembles de données plus petits.
    • Par exemple, si vous avez un ensemble de données de tous les nombres allant de 1 à 100, mais que le nombre 1 est inclus 3 fois, 1 sera la moyenne de mode de l'ensemble, même si la moyenne (et dans ce cas, plus sensible) la moyenne est beaucoup plus proche de 50.
    • Toute enquête qui évalue à grande échelle peut être manipulée pour mettre l'accent sur le mode. Si vous interrogez 100 personnes sur une échelle de 1 à 10 sur leurs sentiments sur un sujet, et que plus de personnes lui attribuent une note de «10» que tout autre nombre, alors même si une seule personne de plus a donné une note de 10 qu'une note de 1, 10 est la moyenne du mode.
  5. 5
    Mentir avec des nombres représentatifs. Si vous disposez d'un ensemble de données défini par des chiffres abstraits plutôt que concrets (par exemple, une enquête de satisfaction client), il est presque effroyablement facile de mentir avec cet ensemble. Si vous demandez aux gens d'évaluer leur satisfaction sur une échelle de 1 à 3, cela ne prouve pas nécessairement que les clients qui ont choisi 3 sont trois fois plus satisfaits que ceux qui ont choisi 1. Ce fait sert notamment à biaiser les moyennes, mais peut également être appliqué aux moyennes médianes et parfois même aux moyennes de mode.

Méthode 2 sur 3: mentir avec des ensembles de données

  1. 1
    Utilisez un petit ensemble. Tout bon statisticien sait que la seule façon d'approcher une moyenne utile ou de repérer une tendance réelle est de rassembler des données à partir d'un ensemble aussi large que possible. Si vous pouvez obtenir des informations de 100 personnes, c'est bien; 10000 c'est encore mieux. Plus vous mettez d'éléments d'information dans votre ensemble de données, plus il est probable qu'il aboutisse à des moyennes précises. En utilisant un ensemble de, disons, 3 ou 5 données, vous pouvez produire des résultats qui ne reflètent pas avec précision l'état des choses.
    • Par exemple, si vous trouvez deux personnes qui ont récemment été blessées par quelque chose de stupide - comme un oreiller - et que vous les utilisez comme ensemble de données complet, vous pouvez faire valoir que les oreillers sont catégoriquement dangereux pour tout le monde. Quelles que soient les moyennes que vous choisissez d'afficher, tant que vous ne révélez pas la taille de votre échantillon de seulement 2 personnes, il n'y a pas de moyen clair de réfuter votre affirmation.
  2. 2
    Utilisez un ensemble contrôlé. Les ensembles de données les plus précis ne sont pas seulement volumineux, ils sont également vastes. Un géologue qui étudie les types de minéraux dans un désert aura une liste plus précise si elle collecte de nombreux échantillons de chaque partie du désert, plutôt que de collecter 1000 échantillons au même endroit. En limitant la portée de votre ensemble de données, vous pouvez influencer considérablement les résultats.
    • Parfois, cela est utile et fait exprès. Les personnes qui effectuent des recherches à l'aide de données démographiques, par exemple, pourraient vouloir se renseigner spécifiquement sur les types d'emplois que les hommes ont tendance à occuper et, par conséquent, n'interrogeront que les hommes. Tant que cela est clairement indiqué dans les données, il n'y a rien de louche à ce sujet.
    • Les données provenant de petits projets de recherche collégiaux, en particulier, ont tendance à être mal utilisées pour assimiler un ensemble de données contrôlé à un résultat général. Cela s'explique par le fait que de nombreux projets de recherche au niveau collégial n'ont ni le temps ni les ressources nécessaires pour utiliser un large échantillon aléatoire de citoyens moyens et reposent plutôt sur des étudiants collégiaux. Encore une fois, c'est bien tant que cette information est clairement indiquée, mais les agences de presse à la recherche de gros titres sensationnels ont souvent obscurci les détails d'une petite étude universitaire pour la faire paraître beaucoup plus radicale.
  3. 3
    Utilisez un ensemble déséquilibré. Cette technique est particulièrement sournoise, car elle peut mentir même avec beaucoup de détails fournis au spectateur. L'astuce ici est d'utiliser des données qui ne peuvent pas être comparées équitablement et de les traiter comme si elles étaient sur un pied d'égalité. Par exemple, si vous avez une ville de 100000 habitants qui a gagné 10000 habitants en 10 ans et que vous la comparez à une ville de 10 habitants qui a gagné 10 habitants de plus au cours des 10 dernières années, les pourcentages pour chaque gain sembleront montrer que le petit la ville s'est développée beaucoup plus rapidement.
    • Ceci est parfois utilisé par les personnes qui analysent les données du marché pour présenter une image trompeuse des chiffres de vente. Disons que vous suivez les ventes de pommes et d'oranges, mais qu'à mi-parcours de l'étude, il n'y a plus d'oranges en raison d'une pénurie. Si vous continuez à comparer les données pour le reste de l'étude, il y aura une énorme augmentation des ventes de pommes par rapport aux ventes d'oranges, même si les pommes ne sont probablement pas devenues soudainement plus populaires.
La moyenne moyenne est atteinte en additionnant tous les nombres d'un ensemble de données
La moyenne moyenne est atteinte en additionnant tous les nombres d'un ensemble de données et en les divisant par le nombre d'entrées dans l'ensemble.

Méthode 3 sur 3: mentir avec des graphiques

  1. 1
    Laissez l'axe des y vide. Rien ne donne une image plus claire des données qu'un graphique ou un tableau, mais même ceux-ci peuvent être subtilement manipulés pour donner des effets différents. C'est parce que les gens ont tendance à regarder les formes et les tailles sur les graphiques avant de se soucier de vérifier les spécificités numériques qui y sont attachées. Le moyen le plus simple de manipuler l'axe des y est tout simplement de ne pas l'étiqueter.
    • Si vous avez un ensemble de 5 barres sur l'axe des x, mais aucun indicateur de leur hauteur les unes par rapport aux autres, il n'y a aucun moyen d'évaluer s'il existe ou non une différence significative entre elles.
  2. 2
    Utilisez des nombres très grands ou petits sur l'axe des y. Disons que votre ensemble de données est compris entre 1 et 50. Pour masquer les différences, mesurez votre axe des ordonnées par incréments de 100; pour les accentuer injustement, mesurez l'axe des y par incréments de 10e. Une différence entre 3 et 10 semble énorme lorsqu'elle est mesurée en dixièmes (c'est 70 unités d'intervalle!), mais est à peine perceptible sur un graphique où 100 est le premier incrément (c'est beaucoup, beaucoup moins d'une unité!).
  3. 3
    Démarrez l'axe y à mi-chemin de la plage. Si vos données vont de 11 à 51, vous pouvez faire paraître le nombre le plus bas encore plus bas et le nombre le plus élevé encore plus haut, en étiquetant votre axe des ordonnées de sorte qu'il commence à 10. Cela rend la barre représentant 11 à peine plus élevée que l'axe des x. Il apparaîtra comme presque rien à moins que quelqu'un soit suffisamment averti pour regarder de près et voir que le graphique a commencé à partir de 10 au lieu de 0.
    • La barre représentant 51 devient 50 fois plus haute que la barre représentant 11 sur un tel graphique, puisque la plus petite barre n'a qu'une unité de haut. Si le graphique avait commencé à 0, la barre représentant 51 aurait été inférieure à 5 fois la hauteur de la barre représentant 11.
  4. 4
    Utilisez une mise à l'échelle incorrecte. Chaque fois que vous voyez les mots «pas à l'échelle» dans les petits caractères, il y a de fortes chances que vous ayez rencontré un exemple de cela. Ce n'est pas toujours fait avec malveillance; parfois, les nombres impliqués sont tellement différents qu'il n'y a aucun moyen de les représenter avec précision sur la même page. Cependant, il peut facilement être utilisé à des fins peu recommandables.
    • Par exemple, une représentation visuelle de la taille pourrait être dessinée à l'échelle de la hauteur mais pas à l'échelle de la largeur, ce qui fait qu'un objet plus grand (comme un bâtiment) semble également beaucoup plus mince ou plus large qu'il ne l'est réellement.
  5. 5
    Utilisez des graphiques pour omettre des données. Ceci est couramment observé dans les grandes enquêtes qui divisent les résultats en certaines catégories, comme le célèbre tableau montrant quel terme pour une boisson gazeuse est le plus populaire dans quel comté à travers l'Europe. À première vue, ces informations semblent très détaillées, mais des questions se posent rapidement: quelle est l'étendue des données de l'enquête? Quel est le seuil pour déterminer le résultat? La moyenne, la médiane ou la moyenne de mode est-elle utilisée?
    • Si vous n'utilisiez qu'un seul résultat pour chaque zone que vous avez étudiée et que vous rejetiez tout le reste, vous pourriez facilement contrôler les résultats par zone sans jamais divulguer que la taille de votre échantillon par zone était minuscule. Encore une fois, c'est le manque d'informations concrètes qui rend les résultats si difficiles à quantifier.
Pour mentir avec les statistiques
Pour mentir avec les statistiques, essayez d'utiliser des nombres anormalement élevés ou bas lorsque vous calculez la moyenne de quelque chose pour faire basculer les résultats.

Conseils

  • En cas de doute, vérifiez. Si vous ne pouvez pas obtenir des informations détaillées et complètes sur la taille, la portée et les méthodes d'échantillonnage d'une statistique, ne lui faites pas confiance.

Mises en garde

  • C'est assez facile de mentir avec des statistiques une fois qu'on sait comment, mais ce n'est pas vraiment éthique. Faites attention à la façon dont vous utilisez les connaissances que vous avez acquises. Ne l'utilisez pas pour blesser, escroquer ou aliéner qui que ce soit.
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail