Théorème du Jury :
déjà sur Okidor :
http://okidor.free.fr/reflects/news.php?lng=fr&pg=1624
http://okidor.free.fr/reflects/news.php?lng=fr&pg=1624
http://okidor.free.fr/reflects/news.php?lng=fr&pg=1881
rappels rapides : Soient des jurés ayant chacun plus 50% de chances de ne pas se tromper (probabilité p >0.5) , et votant OUI/NON en réponse à une question admettant une réponse vraie :
Le théorème dit que plus grand est le nombre de jurés, plus grande est la probabilité que le résultat des votes soit le bon.
*
Nota Bene, situant la naissance de ce théorème au siècle des Lumières ( Condorcet - Rousseau) citation de JJ Rousseau, Du Contrat social Livre II Chapitre 2.3 Si la volonté générale peut errer : « ... On veut toujours son bien, mais on ne le voit pas toujours : jamais on ne corrompt le peuple, mais souvent on le trompe, et c’est alors seulement qu’il paraît vouloir ce qui est mal.
Il y a souvent bien de la différence entre la volonté de tous et la volonté générale ; celle-ci ne regarde qu’à l’intérêt commun ; l’autre regarde à l’intérêt privé, et n’est qu’une somme de volontés particulières : mais ôtez de ces mêmes volontés les plus et les moins qui s’entre-détruisent , reste pour somme des différences la volonté générale.
Si, quand le peuple suffisamment informé délibère, les citoyens n’avaient aucune communication entre eux, du grand nombre de petites différences résulterait toujours la volonté générale, et la délibération serait toujours bonne. Mais quand il se fait des brigues, des associations partielles aux dépens de la grande, la volonté de chacune de ces associations devient générale par rapport à ses membres, et particulière par rapport à l’État : on peut dire alors qu’il n’y a plus autant de votants que d’hommes, mais seulement autant que d’associations. Les différences deviennent moins nombreuses et donnent un résultat moins général. Enfin quand une de ces associations est si grande qu’elle l’emporte sur toutes les autres, vous n’avez plus pour résultat une somme de petites différences, mais une différence unique ; alors il n’y a plus de volonté générale, et l’avis qui l’emporte n’est qu’un avis particulier. ...»
Remarques pour illustrer ce théorème :
P(A ou B) = P(A) + P(B) - P(A et B) avec P(A et B) = P(A) x P(B si A)
Si A et B sont indépendants, cette formule se simplifie car P(A si B) = P(A) :
P(A et B) = P(A) x P(B) => P(A ou B) = P(A) + P(B) - P(A) x P(B)
si chaque votant a la même proba p de ne pas se tromper, alors:
P(bon résultat du scrutin sur 2 votes indépendants de proba p) = 2p - p^2= p+p - p*p (car, avec !p=q=1-p, 1- q*q = 1-(1-p)^2 = 1 - p*p - 1 +2p = p+p - p*p)
____
voir aussi cette proba P(bon résultat du scrutin sur 5 votes indépendants de proba p)=p^3(6p^2 -15p +10) : https://framapic.org/FUKFQ5bdQLye/BulYt3oi6MFY.png
P(bon résultat du scrutin sur 9 votes indépendants de proba p) = p^(9)+9p^(8) (1-p)+36p^(7) (1-p)^(2)+84p^(6) (1-p)^(3)+126p^(5) (1-p)^(4) : https://framapic.org/Jzs2edf1sFe9/rydffIFh4xze.png
____
* Le théorème précise bien qu'il faut que p>0.5 ... mais le problème dans la vie réelle, c'est d'évaluer le p de chaque votant ! ...
et, de plus, les 99,... % des questions soumises au scrutin n'ont peut-être pas de "bonne réponse" ...
Pour chacun de ces deux points c'est pas les électeurs qui en décident ...
Pb de l'élection d'un 'Représentant' : Comment un électeur, inconscient d'avoir une proba p< 0.5 de trouver la bonne réponse à une question (sinon il voterait systématiquement pour l'inverse de son choix naturel, et aurait alors une proba p'=(1-p) >0.5) ... pourrait-il avoir une proba p>0.5 de désigner Le candidat-Représentant qui, Lui, aurait une proba p (de trouver cette bonne réponse) supérieure à celle de tout l'électorat réuni ?! Pire encore si Le candidat, une fois élu, est censé avoir cette proba p supérieure pour toutes les questions (dont la plupart sont encore inconnues) qui se présenteront pendant des années !
_________
précisions par un matheux :
" C'est une loi binomiale, lorsque n est grand la loi binomiale est collée à la loi normale courbe en cloche symétrique par rapport à la moyenne ..."
... conclusion :
"avec p=0,6 donc dans 97,5% des échantillons de 100 votants, on est au dessus de 50,2 votants qui donnent la bonne réponse
donc en votant on a la bonne réponse avec 100 votants dans 97,5% des cas, alors qu'avec un seul votant c'est 60%"
.. Ce sont des calculs en utilisant le théorème de Moivre Laplace qui considère que pour n grand la loi binomiale est collée à la loi normale
maintenant à la calculatrice qui me donne pour la loi binomiale les réponses directes
Pour n= 100 et p=6 P(X>ou =51) =0,973 et P(X > ou =50) =0,983"
pour conclure : σ = sqrt(n*p(1−p))
________
Si l'on veut que la bonne réponse soit obtenue dans 95% des échantillons de vote, dans l'intervalle [np-2 σ ; np+2 σ]
alors on veut : np-2σ > n/2 => np-2σ - n/2 > 0
si p=0,6 alors : σ = sqrt(0,24)* sqrt(n) 0,6 n-2σ - n/2 = 0
=> 0,6 n -2 sqrt(0,24)* sqrt(n) = n/2
=> 0,2 n -4 sqrt(0,24)* sqrt(n) = 0
=> 0,2 sqrt(n) -4 sqrt(0,24)=0
=> sqrt(n) = 4 sqrt(0,24)/0,2 = 20 sqrt(0,24) = 9,797958971132712 n = 96
alors 2 σ = 2*sqrt(0,24)* sqrt(96) = 9,6 et np=96*0.6 = 57.6 et n/2 = 48
Il faut 96 votants pour que la bonne réponse du vote soit dans l'intervalle [np-2σ ; np+2σ] soit entre 57,6-9,6=48 et 57,6+9,6=67,2
__________
Si l'on veut que la bonne réponse soit obtenue dans 99,7% des échantillons de vote, dans l'intervalle [np-3σ ; np+3 σ ]
alors on veut : np-3σ > n/2 => np-3σ - n/2 > 0
si p=0,6 alors : σ = sqrt(0,24)* sqrt(n) 0,6 n-3σ - n/2 = 0
=> 0,6 n -3 sqrt(0,24)* sqrt(n) = n/2
=> 0,2 n -6 sqrt(0,24)* sqrt(n) = 0
=> 0,2 sqrt(n) -6 sqrt(0,24)=0
=> sqrt(n) = 6 sqrt(0,24) /0,2 = 30 sqrt(0,24) = 14,696938456699 => n = 14,696938456699^2 = 216
alors 3 σ = 3*sqrt(0,24)* sqrt(216) = 21,6 et np=216*0.6 = 129.6 et n/2 = 108
Il faut 216 votants pour que la bonne réponse du vote soit dans l'intervalle [np-3 σ ; np+3 σ ] soit entre 129.6-21,6=108 et 129.6+21,6=151,2
__________
Si l'on veut que la bonne réponse soit obtenue
dans 95% des échantillons de vote, dans l'intervalle [np-2 σ ; np+2 σ ]
alors si on veut : np-2σ > n/2
=> np-2σ - n/2 > 0
si p=0,7 alors :
σ = sqrt(0,21)* sqrt(n)
0,7 n-2σ - n/2 = 0
=> 0,7 n -2 sqrt(0,21)* sqrt(n) = n/2
=> 0,4 n -4 sqrt(0,21)* sqrt(n) = 0
=> 0,4 sqrt(n) -4 sqrt(0,21)=0
=> sqrt(n) = 4 sqrt(0,21)/0,4 = 10 sqrt(0,21) = 4,58257569495584
n = 21
alors 2 σ = 2*sqrt(0,21)* sqrt(21) = 4,2 et np=21*0.7 = 14.7 et n/2 = 10.5
Il faut 21 votants pour que la bonne réponse du vote soit dans l'intervalle [np-2σ ; np+2σ] soit entre 10.5 et 18.9
... mais alors !(n>=30) => l'approximation par une loi normale n'est plus valable !
__________
Si l'on veut que la bonne réponse soit obtenue
dans 99,7% des échantillons de vote, dans l'intervalle [np-3σ ; np+3 σ ]
alors on veut : np-3σ > n/2
=> np-3σ - n/2 > 0
si p=0,7 alors : 0.7*0.3=0.21
σ = sqrt(0,21)* sqrt(n)
0,7 n-3σ - n/2 = 0
=> 0,7 n -3 sqrt(0,21)* sqrt(n) = n/2
=> 0,4 n -6 sqrt(0,21)* sqrt(n) = 0
=> 0,4 sqrt(n) -6 sqrt(0,21)=0
=> sqrt(n) = 6 sqrt(0,21) /0,4 = 15 sqrt(0,21) = 6,87386354243376
=> n = 6,87386354243376^2 = 47,25
alors 3 σ = 3*sqrt(0,21)* sqrt(47,25) = 9,45 et np=47,25*0,7 = 33.075 et n/2 = 23,625
Il faut 47,25 votants pour que la bonne réponse du vote soit dans l'intervalle [np-3 σ ; np+3 σ ] soit entre 23,625 et 42,525
Nota Bene :avec 99,7% de votants dans [np-3sigma; np+3 sigma] donc 0,3% à l'extérieur de cet intervalle
et comme la courbe est symétrique par rapport à np, il y a 0,15% de chaque côté de l'intervalle
donc 99,85% au dessus de np-3sigma !
