• AgoraVox sur Twitter
  • RSS
  • Agoravox TV
  • Agoravox Mobile

Accueil du site > Culture & Loisirs > Culture > Le théorème de BAYES

Le théorème de BAYES

Alors que la science a toujours prôné une vision objective du monde, le théorème de Bayes réintègre une dimension subjective : il ne nous parle pas du monde, mais de ce que nous en savons. D’ailleurs c’est exactement ce qu’ont postulé les fondateurs de la mécanique quantique, Bohr et Heisenberg.

En statistiques, on sait calculer la probabilité qu’une cause ait tel ou tel effet. Thomas Bayes (1702 - 1761), mathématicien britannique et pasteur de l'Église presbytérienne, s’est attaqué au problème inverse, celui du raisonnement par induction : connaissant les effets, quelles en sont les causes probables ? Un peu comme Sherlock Holmes, qui observant des gouttes d’eau sur la veste de quelqu’un, en conclut qu’il vient probablement de rentrer d’une averse.

Le théorème de BAYES est le suivant :

Si on désigne par A un évènement et par B un autre évènement, ce théorème se traduit par l’égalité suivante : 

                   P(A|B)=[P(B|A) x P(A)]/P(B)

  • Le terme P(A) est la probabilité a priori de A. Elle est « antérieure » au sens qu’elle précède toute information sur B.
  • Le terme P(A|B) est appelée la probabilité a posteriori de A sachant B (ou encore de A sous condition de B). Elle est « postérieure », au sens qu’elle dépend directement de B.
  • Le terme P(B|A), est la probabilité de B sachant A.
  • Le terme P(B) est appelé la probabilité a priori de B.

Confrontant deux évènements l’un à l’autre, la formule quantifie la probabilité pour l’un d’induire l’autre, remontant ainsi des conséquences vers les causes pour comprendre les phénomènes de la nature.

Cette formule élémentaire a des applications considérables. 

Au cours des siècles qui suivent sa parution, l’intérêt pour cette équation de l’apprentissage statistique semble tomber en sommeil dans le monde académique, malgré un grand nombre d’applications remarquables en ingénierie et en recherche opérationnelle. Sait-on que la plaidoirie de Poincaré pour témoigner de l’innocence de Dreyfus reposait sur la formule de Bayes ? Que celle-ci fut la clé qui permit à Alan Turing de percer le chiffrement des messages cryptés de la machine Enigma employée par l’Allemagne nazie dans ses communications militaires ? Que le Bureau d’Enquêtes et d’Analyses pour la sécurité de l’aviation civile s’est appuyé sur la formule de Bayes pour orienter les recherches de l’épave de l’Airbus AF447 du vol Rio-Paris abîmé en mer le premier juin 2009 ? Chaque jour, dans les PC et les Mac du monde entier, elle permet de débusquer les messages publicitaires (spams) parmi les flots d’e-mails reçus ; on la retrouve aussi à la racine de programmes informatiques qui traquent les fraudes bancaires.

S’appliquant à n’importe quel phénomène, elle produit des résultats, livre des découvertes, établit des vérités. Elle reste pourtant largement méconnue du grand public. Dans le cercle des mathématiciens, elle a donné lieu à des débats violents au point de marginaliser, pendant une bonne partie du 20ème siècle, les bayésiens.

Exemple1. Réchauffement de la terre

Considérons l’hypothèse H : « le réchauffement moyen de notre planète dépassera les deux degrés d’ici 2070 ». Supposons que sans autre information la probabilité de cette hypothèse est évaluée à 40%. P(H) = 0,4.

Supposons que si cette hypothèse est vérifiée, l’évènement O « la fonte de la calotte glaciaire » a une probabilité de 60% de se réaliser. P(OǀH) = 0,6.

Supposons que la probabilité de l’évènement O est estimée à 30% en l’absence d’information externe. P(O) = 0,3.

La petite formule de Tom Bayes permet d’évaluer la pertinence de ce qu’on croit savoir (H) à l’aune de l’information apportée par une observation (O). P(H|O) = P(H)*P(O|H) / P(O)

P(H|O) = 0,4 * 0,6 / 0,3 = 0,8.

Ce résultat veut dire que, si l’on constate que la calotte glaciaire a fondu, alors la probabilité que le réchauffement moyen de notre planète dépasse les deux degrés d’ici 2070 est de 80%.

Exemple-2. D’où provient l’ivoire de contrebande ?

Sur le site www.mpt2013.fr, Gilles Guillot, de l’Université technique du Danemark, décrit une application originale : les statistiques bayésiennes sont utilisées pour identifier l’origine des ivoires d’Afrique saisis par la douane aux aéroports. L’ADN prélevé sur les ivoires est comparé à celui d’éléphants dont l’origine géographique est bien identifiée ; la formule de Bayes utilise ces informations pour calculer la probabilité que l’échantillon provienne d’une certaine latitude et longitude, et pour identifier ainsi son origine probable. A l’échelle du continent africain, la moitié des échantillons peuvent ainsi être localisés avec une erreur inférieure à 500 km.

Exemple-3. Les élections américaines

Six jours avant les élections présidentielles américaines du 6 novembre 2012, les sondages donnaient les deux candidats à égalité. Le jour même de l’élection, ils enregistraient un écart de 0,7% en faveur de Barak Obama sur Mitt Romney. Dans le monde entier, le suspense est alors à son comble. On craint une élection très serrée, comme en 2004 entre Georges W Bush et John Kerry ou sur le fil du rasoir, comme en 2000 entre Georges W. Bush et Al Gore. Pourtant, ce même jour, un statisticien américain, Nate Silver, 34 ans, donne 92% de chances pour Barak Obama vainqueur. Sur son blog, FiveThirtyEight, il se paye même le luxe d’enregistrer 100% de bonnes prédictions concernant les résultats État par État, Floride comprise alors que le décompte final n’a été connu que le 10 novembre, plusieurs jours après les prédictions de ce blogueur : Nate Silver, lui, donnait 50,3% de chance de victoire à Barak Obama. Ce dernier l’a finalement emporté avec 50% des voix contre 49,1% à Mitt Romney. Dans tous les États, le blogueur a vu juste. Quant au nombre de votes électoraux obtenus par chaque candidat, il avait prédit 313 pour Barak Obama et 225 pour Mitt Romney pour un résultat réel de 332 contre 206. Nate Silver a utilisé la démarche logique basée sur le théorème de Bayes.

Exemple-4 : La justice française se trompe

Éric Zemmour , écrivaillon crypto-sioniste et journaliste politique français, est connu du public pour ses positions hostiles aux immigrés en général, aux Arabes et aux Noirs, en particulier, alors que lui-même est d’origine immigrée.

Il a été condamné par un tribunal français pour avoir déclaré : "la plupart des trafiquants sont noirs et arabes". Cependant, le tribunal qui l’a condamné pour ce « propos raciste » s’est trompé. Car constater, que, statistiquement , "la plupart des trafiquants sont noirs et arabes" est différent de dire que "la plupart des Noirs et des Arabes sont des trafiquants", ce qui serait raciste et donc condamnable.

En appliquant le théorème de Bayes, Jean-Michel Claverie démontre que le premier énoncé n'implique absolument pas le second : il démontre que la proportion (techniquement la "probabilité conditionnelle") des émigrés parmi les délinquants peut largement dépasser 50 % (propos de Zemmour) sans que la proportion des délinquants parmi les immigrés (le propos raciste) soit beaucoup plus élevée qu'elle ne l'est parmi la population « gauloise ». Et si l'on introduit, en plus, le fait avéré que le taux de délinquance est plus fort parmi les tranches de population à bas revenus, là où se situe la majorité des immigrés, on peut même trouver des situations où les immigrés sont simplement plus vertueux que les franchouillards !

La formule (de Bayes) qui aurait dû relaxer immédiatement Zemmour, est :

P(trafiquants|émigrés) = P(immigrés|trafiquants) x P(trafiquants) / P(émigrés)

A = B x C / D

Nous allons nous baser sur les statistiques officielles françaises. Le dernier volume publié (2008) par la statistique judiciaire, dans la série « Les condamnations », donne 2 187 personnes condamnées pour trafic (import, export) de drogues, dont 37 % d'étrangers. Parmi ces étrangers condamnés, 167 sont des ressortissants d'un des trois pays du Maghreb mais surtout 137 sont Marocains (soit 20,5 % des étrangers et 7,6 % de l'ensemble des condamnés), ce qui n'a rien de surprenant puisque le Maroc est le principal producteur de Cannabis alimentant le marché français. En 2008, la France compte 64 millions d’habitants. Donc la probabilité de trouver un trafiquant de drogue dans cette population est de 2187/64000000, soit 0,0034%. Donc C=0,0034%.

  • En 2008, les immigrés représentaient 8,4% de la population. Parmi ces immigrés, 43% sont noirs ou Maghrébins. Donc D=8,4% x 43% = 3,6%.
  • B=37%.

Ce qui donne A = 0,035%, c'est-à-dire que, sur 20.000 immigrés noirs et arabes, il y aurait en moyenne 7 trafiquants, les 19.993 autres ne le sont pas.

En prenant l’affirmation de Zemmour au pied de la lettre « Plus de la moitié des trafiquants sont noirs ou arabes », et bien qu’elle soit fausse d’après les statistiques officielles ci-dessus, on aurait avec B = 60%, en moyenne 10 trafiquants pour 20.000 immigrés, ou bien 1 sur 2.000 !! Pas de quoi justifier de renvoyer chez eux les 1.999 autres qui ne font rien de répréhensible. Une autre chose que montre ce calcul, c'est l'influence terriblement négative que peut avoir une infime fraction de délinquants sur la perception de la minorité dont ils sont issus.

Une formule adaptée au troisième millénaire

Voici donc l’interprétation qui est attribuée à cette formule, quand on a compris qu’il était possible de mettre la formule en réseau c'est-à-dire comme l’a fait le mathématicien Judea Pearl (spécialiste en intelligence artificielle, prix Turing en 2011) en montrant qu’en alignant des centaines de formules de Bayes, il devait être possible de rendre compte des multiples causes d’un phénomène complexe. Grâce à l’informatique on a établi, dans de nombreux domaines, des réseaux bayésiens où chaque nœud est relié à un autre via la formule de Bayes. C’est ainsi que l’on construit des modèles de phénomènes complexes, même lorsque les observations sont insuffisantes ou noyées dans le bruit parasite.

Remontant inlassablement des événements jusqu'à leurs causes, le réseau de formules de Bayes construit des modèles de phénomènes complexes, même lorsque les observations sont insuffisantes ou noyées dans du bruit parasite. Leur grande force, c'est de faire la synthèse entre le dire des experts et les données brutes de l'observation quand celles-ci sont insuffisantes : la connaissance a priori comble la lacune des mesures. Plus grande est l'ignorance, plus la formule montre de sa puissance...

En faisant appel aux connaissances préalables de l'observateur, détachées des faits eux-mêmes et qui ont un aspect personnel, cette formule donne une image de la réalité extérieure tout en exprimant également la méconnaissance de l'observateur face à cette réalité. De cette petite formule ré-émerge ainsi une idée philosophique depuis longtemps débattue. "Elle nous oblige à penser que les théories et modèles scientifiques reflètent notre représentation de la réalité plutôt que la réalité elle-même. Cette dernière se chargeant de nous fournir des données qui garantissent que notre représentation n'est pas trop éloignée de la vérité", résume Christian Robert, professeur au Centre de recherche en mathématiques de la décision de l’université Paris-Dauphine.

http://numidia-liberum.blogspot.com/2012/11/theoreme-de-bayes-ou-la-formule-magique.html

Hannibal Genséric

Aujourd’hui, ses applications sont extrêmement diverses, comme le mentionne le numéro de la revue Science et vie de Novembre 2012. Au point de se demander pourquoi elle n’est pas ouvertement exploitée par les instituts de sondage. La réponse est peut-être purement économique. Le maintien d’un suspense intense stimule la demande de nouveaux sondages. Avec Bayes, les jeux seraient sans doute faits plus vite. D’où un considérable manque à gagner.

 


Moyenne des avis sur cet article :  3.67/5   (15 votes)




Réagissez à l'article

8 réactions à cet article    


  • Crab2 8 novembre 2013 13:29

    Écran de fumée

    ... est accusée de racisme toute personne qui prend position pour un traitement pragmatique de la venue de migrants vers notre pays, puis dans la foulée d’y associer la réflexion critique de la religion musulmane

    Suites :

    http://laicite-moderne.blogspot.fr/2013/11/ecran-de-fumee.html


    Blog :

    http://laicite-moderne.blogspot.fr/



    • Bernard Dugué Bernard Dugué 8 novembre 2013 13:55

      Intéressant article

      à noter le regain d’intérêt des inférences bayésiennes en neurosciences (Friston) et en biologie théorique (Auletta)

      http://en.wikipedia.org/wiki/Bayesian_approaches_to_brain_function


    • Senatus populusque (Courouve) Senatus populusque (Courouve) 8 novembre 2013 14:15

      Ce théorème, P(A|B)=[P(B|A) x P(A)]/P(B), peut se démontrer facilement à partir de deux expressions de p(A∩B) (probabilité de l’intersection de A et de B) utilisant les probabilités conditionnelles.


      p(A∩B) = p(B|A)p(A) = p((A|B)p(B)

      En divisant les deux membres de l’égalité p(B|A)p(A) = p((A|B)p(B) par p(B), on obtient la relation du théorème.

      • Luc-Laurent Salvador Luc-Laurent Salvador 8 novembre 2013 16:33

        Très bonne synthèse qui devrait mettre le lecteur en appétit.

        Comme l’indique Dugué il manque quand même la prodigieuse prétention des bayésiens qui ont lancé une OPA sur le fonctionnement cérébral et carrément la psychologie.

        En lisant le Science et Vie j’ai eu une furieuse envie de critiquer ces tentatives mais en grattant autour j’ai découvert une telle vague de fond que j’ai été complètement submergé.

        Je garde ma conviction que l’OPA échouera mais la partie sera difficile.

        Disons que très probablement il faudra attendre (longtemps) que le mouvement s’épuise pour qu’on en reconnaisse enfin les limites et l’illégitimité de ses prétentions.

        En attendant, on a pas fini d’en entendre parler !


        • Hannibal GENSERIC Hannibal GENSERIC 8 novembre 2013 18:23

          @L.L. Salvador et Dugué. Tout à fait d’accord avec vous. C’est pour cela que je n’ai pas abordé le sujet.


        • Taverne Taverne 8 novembre 2013 16:48

          Moi, ici, je ne connais que le théorème de Pythagoravox...


          • christophe nicolas christophe nicolas 9 novembre 2013 12:06

            Je vais vous dire ce qu’est Heisenberg avant de s’amuser sur les probabilités. En mécanique quantique, la précision a des limites, à un moment dans une expérience d’interférence, vous ne pouvez plus distinguer si une particule passe par la 1er fente ou la deuxième. En fait, elle semble passer par les deux fentes à la fois puisque elle interfère. Du coup, on énonce les résultats en probabilité puisque on ne sait pas faire autrement.

            Je ferais remarquer que c’est vrai dans la vie réelle mais qu’on fait comme si cela ne l’était pas, on fait comme si on pouvait s’en affranchir avec plus de maitrise or c’est faux, on ne peut jamais s’en affranchir. On retombe à la fin sur Heisenberg.

            Après, les probabilités engendrent des théories philosophiques septiques idiotes qui tuent Dieu, la Vérité, la Justice et engendrent le pragmatisme et le doute dans l’esprit alors que c’est de l’ordre de l’outil d’investigation, d’un manque de connaissance pour des raisons pratiques. La solution d’un problème ne se trouve pas par un enchainement d’action mais par la recherche d’un minimum, ce qui fait plutôt appel à l’intuition mais qui peut devenir vite très complexe. Les tricheurs et es menteurs... prennent appui sur les probabilités pour prouver qu’ils sont justifiés. Les faux s’auto justifieront toujours très facilement par une fausse raison.

            Ce qui est caché derrière Heisenberg, c’est que « toute choses sont liées ». Une expérience prend tout en compte dès le départ. Si le premier chemin par une fente et le deuxième chemin par l’autre fente donne des résultats inverses au même endroit à cause d’une demi longueur d’onde d’écart, alors l’actualisation de cette potentialité s’effondre. Cela est possible car « toutes choses sont lièes » dans un principe de moindre action. Si on prend l’optique d’examiner le problème sous le dogme de « la marche au hasard », on ne comprend rien et on se contente des mathématiques. C’est l’explication de Copenhague qui fait que les papy scientifiques en perdaient leur latin. Le meilleur fut l’autrichien Pauli dont l’orgueil fut réduit à néant par sa vache de femme qui partit avec un mathématicien ce qui est l’insulte suprême pour un physicien. Du coup, il eut l’intuition géniale « du principe de Pauli » qui dit « aucun fermion ne peut être dans le même état quantique » ce qui est une autre manière de dire que « toutes choses sont liées ». Les femmes ont l’art d’insulter les génies pour les blaireaux parce que « la norme » les rassure et qu’elles veulent pondre des œufs. Elle oublie que Dieu n’aime pas les tièdes en esprit, quelles confondent souvent avec le pognon. Tu de beaux $$, tu sais... je digresse...

            En posant le dogme de « la marche au hasard » en premier principe on passe son temps à reposer des principes secondaires. Il est plus simple de poser dès le début « toutes choses sont liées » ou « la fonction d’onde de l’univers est constante, éternelle et infinie », ca évite les perpétuelles circonvolutions.

            Le monde est -il probabiliste ? Non, c’est une crétinerie, c’est l’inverse, Dieu existe, Dieu est Justice mais cela reste mystérieux car la partie du tout (homme) ne peux le saisir sans changer le problème puisqu’il en est une composante. En revanche, vous , vous ne pouvez pas changez le « tout » car la fonction d’onde l’univers est constante, même en faisant sauter la planète malgré le degrés de liberté dont vous jouissez. La probabilité ne traduit que notre incapacité à saisir la fonction d’onde de l’univers. En revanche le souffle de Dieu peut vous balayer quand il veut si la coupe de le justice divine déborde.

            Conclusion : le pragmatisme philosophique est absurde donc ne lisez les anglo saxons, leurs ouvrage philosophique tiennent du livre de cuisine.

            Quand aux septiques, comment peuvent t’ils affirmer que la vérité n’existe pas puisque « affirmer » admet implicitement la vérité qui n’est que la conformité de l’esprit avec le réel, une aspect seulement mais assurément vrai.

            Alors par où passe la particule ? Par une seule fente mais si vous obturez l’autre vous n’aurez pas le même résultat car vous modifiez les potentialités du dispositif expérimental.

            En terme humains :« si un voleur vient braquer une boulangerie et qu’au moment de faire son forfait un policier rentre acheter sa baguette, le voleur ressort sans avoir braqué la boulangerie, il n’a pas agit mais il a changé les potentialité dans l’esprit du voleur », c’est ça la mécanique quantique avec un peu de maths en plus. Le physicien a toujours d’un matheux pour se reproduire, c’est pour rire... n’allez rien imaginer. C’est à cause de mes blagues que les frustrés de la vie m’ont fait une sale réputation, c’est ça la croix moderne de l’esprit. Les traitres débiles qui en sont encore à Newton dénoncent, les scientifiques gardien du temple accusent, le pouvoir se fait complice pour garder son autorité. Vous payez pour leurs conneries... Voyons voir le code pénal, Dieu est à quel chapitre ? Josué, regardez Josué...

            Torchés les pépés scientifiques.... Bohr et compagnie... Ce problème s’appelle aussi « le chat de Schrödinger ».

            Je ne suis pas comme Laplace, « j’ai besoin de Dieu comme hypothèse » : theorie-de-l-intrication


            • Crab2 9 novembre 2013 13:42

              L’UNIVERSEL

              Se référer à une idée ou un concept ’’ dieu ’’ sans être en mesure de démontrer qu’il n’est rien de plus qu’une hypothèse ;

              ce qui n’est pas le cas de l’Évolution qui n’est pas une théorie mais un FAIT

              Quand au ciel il n’est investi que pour nier la vie sur terre :


              http://laicite-moderne.blogspot.fr/search?q=L%27UNIVERSEL


Ajouter une réaction

Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page

Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.


FAIRE UN DON







Palmarès