Penser l’avenir comme un météorologue

YouTube player

Le futur n’est pas déterminé, il est probabiliste.

Emile Servan-Schreiber explique comment penser les probabilités, et comment évaluer objectivement la justesse d’une prévision.

  • Les seules prévisions valables sont celles qui sont exprimés sous forme de probabilité.
  • Une prévision n’est jamais simplement bonne ou mauvaise.
  • Le score de Brier permet de mesurer la justesse d’une prévision.

Transcript :

Ce tutoriel vous apprendra à exprimer une prévision sous la forme d’une probabilité et à en évaluer la justesse.

Les gens font constamment des prévisions, mais ils utilisent souvent des mots vagues comme : « la victoire est probable« , « il y a une chance qu’il pleuve », ou « l’équipe est favorite pour remporter le match ». Cependant, de telles prévisions sont tout à fait inutilisables tant qu’elles ne sont pas correctement quantifiées.

« Probable » peut signifier n’importe quelle probabilité entre 51% et 99%.

« Une chance de » pourrait tout aussi bien signifier 1% ou 99%, ou toute autre valeur intermédiaire.

 » Favori  » signifie simplement plus probable que quelque chose d’autre, mais pas de combien.

Ainsi, au lieu d’utiliser un vocabulaire imprécis, une bonne prévision est une estimation quantitative de la probabilité qu’un événement se produise dans le futur.

Un type de prévision bien connu est la météo. Dire qu’il y a 80 % de chances que la journée de demain soit ensoleillée est une prévision valable, dans la mesure où elle présente un cadre temporel défini et une valeur quantitative précise.

Mais les prévisions peuvent également concerner le sport, l’économie, la géopolitique, voire les épidémies ou tout autre sujet susceptible d’être observé dans le futur.

Mais que signifie réellement l’expression « 80% de chances » qu’un événement se produise ? Est-ce que « 80% de chances de soleil » signifie qu’il fera beau ? S’il pleut, ma prévision était-elle juste ou fausse ?

De nombreuses personnes ont du mal à interpréter les probabilités numériques telles que « 80 % de chances ». La recherche suggère qu’il est plus utile de penser en termes de fréquences relatives.

Par exemple, dire qu’il y a « 80 % de chances d’une journée ensoleillée » signifie qu’il y aurait du soleil 8 jours sur 10. Mais cela implique aussi qu’il n’y aura pas de soleil les 2 jours restants.

Pour certains problèmes de prévision, il est possible d’examiner les données historiques et d’en tirer  une bonne estimation de la fréquence relative.

Par exemple, si je dois prédire s’il va pleuvoir demain à Paris, je peux chercher sur Google les données météorologiques passées et apprendre qu’il a plu 111 jours l’année dernière. Cela me donne une estimation de la fréquence relative des jours de pluie dans cette région de la France : environ 30 %.

Les statisticiens appellent cette fréquence historique le taux de base, c’est-à-dire la fréquence à laquelle quelque chose a tendance à se produire, en moyenne. Le taux de base est un concept important pour les prévisions, et nous y reviendrons plus tard.

Mais d’abord, un petit mot sur comment ne pas penser les probabilités. Par défaut, la plupart des gens traitent les probabilités comme un sélecteur à trois positions : 0 % (« aucune chance ! ») ; 100 % (« une certitude ») ; et 50/50 (« un pile ou face »).

Mais les études démontrent que les meilleurs prévisionnistes ont tendance, eux, à considérer un large éventail de probabilités lorsqu’ils font leurs prévisions. Les bons prévisionnistes sont capables de distinguer une probabilité de 50 % d’une probabilité de 45 %, ou une probabilité de 69 % d’une probabilité de 75 %, et ainsi de suite. Ils savent différencier au moins 50 « nuances » de probabilités.

Que pouvons-nous donc déduire d’une prévision qu’il y a « 80 % de chances » qu’il fasse beau demain?

Pour commencer, cela signifie qu’il y a 20 % de chances qu’il ne fasse pas beau.

C’est une caractéristique importante des probabilités : pour tout ensemble de possibilités mutuellement exclusivess (par exemple, soit il fera beau demain, soit il ne fera pas beau), la somme des probabilités doit toujours faire 100 %.

Supposons maintenant que je prévoie qu’il y ait 80 % de chances que le soleil brille demain, mais qu’il pleut. Ai-je eu tort ? Eh bien… Je pourrais dire que j’ai également prévu qu’il y avait 20 % de chances qu’il ne fasse pas beau – ne diriez-vous pas que j’avais aussi un peu raison ?

Les prévisionnistes professionnels utilisent une mesure de justesse appelée le score de Brier qui permet d’évaluer le niveau d’erreur d’une prévision probabiliste.

Cette courbe représente l’erreur d’une prévision en fonction de la probabilité attribuée à un événement qui s’est effectivement produit. Si vous lui avez attribué 100% de chances, votre erreur est de 0. En revanche, si vous lui avez attribué 0% de chances de se produire, votre erreur est de 2. C’est l’erreur maximale. Donc, plus vous donnez de chances à l’événement de se produire, plus votre erreur est faible.

La courbe inverse représente votre score au cas où l’événement ne se produirait pas. L’erreur est alors la plus élevée si vous avez donné 100% de chances à un événement qui ne se produit pas.

Notez toutefois que la courbe d’erreur n’est pas symétrique autour de la prévision de probabilité 50-50. Cela signifie que vous pouvez perdre plus en pariant du mauvais côté de 50-50 que vous pouvez gagner du bon côté de 50-50. C’est fait exprès pour pénaliser l’excès de confiance et récompenser l’humilité.

Découvrez les secrets des prévisionnistes d’élite dans notre prochaine vidéo « le CODE des pronostiqueurs d’élite ».

Pour demander une démo ou simplement nous poser vos questions.