Probabilité de résultats lors d'une élection

Probabilité de résultats lors d'une élection - Sciences - Discussions

Marsh Posté le 18-03-2008 à 09:06:21    

Le résultat de l'élection du 5e arrdt m'a quelque peu interpellé.

 

Au début du dépouillement, il y avait 5 points d'écart entre LCS et JT en faveur de LCS, et à la fin, JT a rattrapé son retard.
Si on considère que les résultats partiels sont des projections basées sur les élections passées, c'est probablement possible. Mais si ce sont juste des décomptes partiels, cela soulève des questions.

 

En tout cas c'est une occasion de se remuer un peu les méninges:
1. est-il légitime de supposer que la distribution des votes est constante dans le temps lors du décompte pour plus de 10% des bulletins, soit 2500 votes ?
2. Si oui,  et si on suppose que les premiers résultats sont juste des décomptes partiels, disons à 10%, 20%, 33% et 66% du décompte total, comment calculer la probabilité qu'un tel résultat arrive ?

 

A titre indicatif, le résultat final était:

 
Code :
  1. JT            11269    45,00% 50,50%
  2. LCS           11044    44,10% 49,50%
  3. M              2730    10,90%
  4. Total         25043   100,00%
 

J'utiliserais bien la loi binomiale pour ce calcul.


Message édité par el muchacho le 18-03-2008 à 09:45:09

---------------
Les aéroports où il fait bon attendre, voila un topic qu'il est bien
Reply

Marsh Posté le 18-03-2008 à 09:06:21   

Reply

Marsh Posté le 18-03-2008 à 09:21:54    

C'est dur à dire vu que les votes doivent être plus ou moins corrélés selon les villes. Genre si tu as 60-40  à mi-temps, il est bien probable que ceux qui votent après conservent à peu près les mêmes proportions, alors que si tu supposes les votes indépendants tu auras une espérance de 50-50.

 

Donc il manque une donnée à ton problème.

 

EDIT : ah oui ok toi tu veux utiliser les taux des résultats intermédiaires comme probas que les suivants votent pareil. Ca peut marcher en première approximation je suppose ouais :o


Message édité par _iOn_ le 18-03-2008 à 09:30:23

---------------
Any sufficiently complex bug is indistinguishable from magic.
Reply

Marsh Posté le 18-03-2008 à 09:34:27    

Tout-à-fait. C'est la réponse à la question 1 et l'hypothèse sous laquelle on peut faire ce type de calcul. Hypothèse d'échantillonnage qui est discutable, mais sans elle, effectivement, on peut avoir absolument tout et n'importe quoi, y compris 100% de votes dans un camp à partir de la moitié du décompte.
C'est aussi l'hypothèse qui est utilisée par les instituts de sondage quand ils extrapolent à la population totale des résultats d'échantillons de 1000 personnes.


Message édité par el muchacho le 18-03-2008 à 09:37:43

---------------
Les aéroports où il fait bon attendre, voila un topic qu'il est bien
Reply

Marsh Posté le 18-03-2008 à 10:54:45    

Ce que tu veux qu'on calcule est ce qu'on appelle en statistique un intervalle de confiance.
 
Soit X la variable qualitative représentant le vote pour JT, par exemple.
On connait la fréquence observée f(X) = 42 % d'un échantillon d'effectif 2500 considéré comme représentatif*, et on souhaite estimer la fréquence théorique p(X) de la population. On construit donc unintervalle de confiance.
 
On considère que f est normale (c'est-à-dire qu'elle suit la loi normale, la loi du hasard en quelque sorte) de moyenne p et d'écart-type la racine carrée de pq/N (avec q = 1- p).
On estime que cet écart-type est égal à la racine carrée de f(1-f)/N.
 
On pose alors U = (f - p) / écart-type, donc U est normale de moyenne 0 et d'écart-type 1. (ce changement de variable permet de simplifier les calculs en se ramenant toujours à la même loi normale : la loi dite centrée réduite)
 
Alors, comme Nf et N(1-f) > 5 (ce sont des conditions pour appliquer cette loi), d'après la loi centrée réduite, p appartient à l'intervalle [f + ou - U(a) * racine carrée de (f(1-f)/N)], au risque a de se tromper.
 
Maintenant, passons aux chiffres : mon intervalle de confiance est [0,42 + ou - 0,0165] à 5% de risques.
 
Autrement dit, j'ai 95 % de chances d'avoir raison d'affirmer que, au moment où j'ai mes décomptes partiels, JT va faire entre 40,35 et 43,65 %.
 
La probabilité qu'il fasse 45 % est de 0,135 %, c'est pourquoi 45 % ne figure pas dans mon intervalle. Et pourtant, je me suis planté alors que j'avais seulement une chance sur 750 que ça m'arrive !
 
 
*On peut s'interroger sur la représentativité, puisqu'il s'agit des 1ers votants (donc peut-être les plus énervés par quelque chose, peut-être ceux qui se font chier le WE, etc...) et que les suivants auront entendu les résultats partiels (ça peut les motiver à aller voter. Mais bon pour l'exemple considérons l'échantillon comme représentatif, sinon on ne peut rien calculer !


Message édité par _Genesis_ le 18-03-2008 à 10:59:56

---------------
"Il ne suffit pas de diaboliser une opinion pour la discréditer. Il faut dire en quoi elle est fausse."
Reply

Marsh Posté le 18-03-2008 à 11:29:25    

Merci, j'examinerai le calcul dès que j'aurai un peu de temps, mais j'observe que mon intuition qu'une telle remontée est extrêmement improbable était juste. Tu utilises le théorème central limite pour une loi normale, ce qui n'est pas déconnant pour 2500 votants.
Pour ce qui est de la représentativité, tes remarques sont pas idiotes du tout. Mais si dans le 5e ça se passe comme dans mon bureau de vote, l'urne est vidée sur une table et les enveloppes un peu mélangées à la manière de cartes à jouer avant d'être disposées en tas. Je ne sais pas si c'est une procédure obligatoire.

Message cité 1 fois
Message édité par el muchacho le 18-03-2008 à 11:31:46

---------------
Les aéroports où il fait bon attendre, voila un topic qu'il est bien
Reply

Marsh Posté le 18-03-2008 à 13:31:06    

Il faut adopter la méthode de l'adjoint de Bayrou à Pau, tested and disapproved ; hier j'écoutais RTL et ils avaient suivi Bayrou et sa clique tout dimanche ; je vous passe les réflexions de haute volée et les citations innapropriée pour conjurer le mauvais sort, ce serait HS.
 
Donc, l'adjoint de Bayrou se pointe au dépouillement dans un bureau.
1er bulletin : Bayrou
2ème bulletin : Bayrou
3ème bulletin : Bayrou
 
Et là son adjoint sort un truc du genre "la tendance est bonne, je le sens bien, on va gagner ..."  :lol:

Reply

Marsh Posté le 18-03-2008 à 15:51:11    

Reply

Marsh Posté le 21-03-2008 à 19:17:57    

el muchacho a écrit :


Pour ce qui est de la représentativité, tes remarques sont pas idiotes du tout. Mais si dans le 5e ça se passe comme dans mon bureau de vote, l'urne est vidée sur une table et les enveloppes un peu mélangées à la manière de cartes à jouer avant d'être disposées en tas. Je ne sais pas si c'est une procédure obligatoire.


 
Salut, si le mélange est mal fait il n'est pas étonnant de voir les résultats fluctuer autant, il est avéré que ce sont des populations différentes qui votent selon la tranche horaire, statistiquement l'hypothèse d'équiprobabilité n'est alors pas respecté et l'échantillon tiré n'est alors pas représentatif.
 
Au moment du décompte des partiels, l'intervalle de confiance expliqué par Genesis est très approprié pour déterminer avec une bonne approximation le vainqueur : Si les intervalles de confiances de chaque candidat se chevauchent, alors on ne peux pas vraiment conclure, mais si les intervalles sont distinct alors on peut déterminer le vainqueur.
 
*remarque* dans le calcul de Genesis tu prends 0,42 mais muchacho n'a pas précisé le résultat partiel juste qu'il y'avait 5 points de différences, si tu prend 0,44 l'intervalle de confiance n'est alors plus contradictoire car il comporte le résultat final.
 
 
 
Pour répondre à ta première question muchacho, lorsque l'on connait le résultat final, il faut faire un test de conformité de fréquence
qui te donnera précisément cette probabilité avec un risque contrôlé (mais il faut également le résultat exact du partiel)
 
Si le test est rejeté, alors on peut quand même soupçonner une éventuelle tricherie ou juste un mauvais mélange ;)
 
 
 
 
 
 
 
 

Reply

Marsh Posté le 21-03-2008 à 22:29:59    

fusion_sadam a écrit :

*remarque* dans le calcul de Genesis tu prends 0,42 mais muchacho n'a pas précisé le résultat partiel juste qu'il y'avait 5 points de différences


Oui j'ai pris ça un peu au hasard, il me fallait une valeur pour l'exemple.
 
 
 

fusion_sadam a écrit :

Pour répondre à ta première question muchacho, lorsque l'on connait le résultat final, il faut faire un test de conformité de fréquence


Oui, moi je connais ce test sous le nom d'intervalle de pari. C'est un peu l'inverse de ce que j'ai fait : on prend la fréquence finale puis on calcule un intervalle dans lequel on a 95 % de chances (par exemple) de trouver la fréquence d'un échantillon pris au hasard (et donc représentatif de la population votante totale). Si la fréquence du partiel n'est pas dans cet intervalle, j'ai 95 % de chances d'avoir raison d'affirmer qu'on a triché !
 
Pour l'exemple chiffré, j'ai la flemme...  :bounce:


---------------
"Il ne suffit pas de diaboliser une opinion pour la discréditer. Il faut dire en quoi elle est fausse."
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed