loi binomiale ou hypergéométrique ou bernoulli ? [Stat] - Aide aux devoirs - Emploi & Etudes
Marsh Posté le 03-03-2012 à 15:25:19
Positiviste a écrit : Bonjour,
|
1ère question OK
2nde question, il faut se souvenir que :
- loi de Bernoulli B(p) correspond à une variable aléatoire prenant la valeur 0 ou 1, avec une proba p d'obtenir 1
- loi Binomiale B(n,p) : variable aléatoire correspondant au nombre de succès pour n épreuves de Bernoulli de paramètre p
Donc si on échantillonne 10 individus *avec remise* dans ta ville de 100000 habitants, alors ne nombre vivant dans l'hypercentre suivrait une Binomiale B(10,0.2). Dans ce cas la taille initiale de la ville n'a aucune importance puisqu'un individu déja échantillonné peut l'être à nouveau.
Par contre si on échantillonne *sans remise*, alors le nombre d'habitants dans l'hypercentre suivra une hypergéométrique H(n,p,N) où n est la taille de l'échantillon, p la proba de succès, et N la taille de la population dans laquelle on échantillonne. Donc dans notre cas H(10,0.2,100000)
si X~B(10,0.2) on a E(X)=n*p=2 et Var(X)=n*p*(1-p)=10*0.2*0.8=1.6 ; et donc ecart-type(X)=racine(1.6)
si X~H(10,0.2,100000) on a E(X)=n*p=2 et Var(X)=n*p*(1-p)*(N-n)/(N-1)=10*0.2*0.8*99990/99999=1.599856 ; et donc ecart-type(X)=racine(1.599856)
en gros, vu que la taille de la ville est grande par rapport à la taille de l'échantillon, que l'on échantillonne avec ou sans reise ne change pas grand chose. Sur une ville de 100 habitants au lieu de 100000, on aurait eu Var(X)=1.454545... avec échantillonnage sans remise contre toujours 1.6 avec remise.
Je ne sais pas si ton exo précise le mode d'échantillonnage...
Marsh Posté le 04-03-2012 à 16:07:07
Ok merci
Je comprend mieux la différence entre Bernoulli est Binomiale
nan il précise pas.
La suite :
Citation : 3. Quelle est la probabilité exacte de tirer un échantillon comprenant 3 personnes ou moins vivant dans l’hyper centre ? |
Donc la je me suis basé sur "tirage avec remise"
La probabilité exacte de tirer un échantillon comprenant 3 personnes ou moins vivant dans l’hyper centre est de 0,85
---
Citation : Pour l’enquête on tire 200 personnes |
Ici la question ressemble trés fortement à la question deux donc je me dis que c'est binomiale ou hypercentre sauf que le mot "nombre de personne" a été remplacé par "proportion de personne"
Je me dit alors qu'il s'agit d'une autre loi et qu'un cours de vocabulaire aurait tout autant été utile en premier lieu.
Je trouve çà vicieux.
De quelle loi s'agit -il ?
et pourquoi ?
Marsh Posté le 04-03-2012 à 23:27:58
Pour la 3ème question tes formules sont OK sous l'hypothèse Binomiale (tirage avec remise) ; c'est juste que tes arrondis sont un peu cavaliers. Avec des arrondis plus fins on obtiendrai 0.87912612. Sous l'hypothèse Hypergéométrique ça donnerait 0.87913669 (identiques jusqu'à la 5ème décimale...)
Pour la 4ème question, à mon avis le prof veut que vous utilisiez le Théorème Central-Limite (vérifie tes cours) qui dit en gros que si la taille de l'échantillon est "assez grosse" (200 collerait bien) alors la moyenne de (quasi) toute variable aléatoire sur cet échantillon suit approximativement une loi Normale d'espérance égale à l'espérance la loi originelle, et de variance=variance originelle/taille de l'échantillon (je simplifie un peu). Ici ta variable aléatoire originelle est la Bernoulli B(0.2), et donc la moyenne sur un échantillon de taille 200 suivrait une N(0.2, 0.2*0.8/200), c'est-à-dire une N(0.2,0.008).
PS : la loi "hypercentre" n'existe pas...
Marsh Posté le 05-03-2012 à 11:44:15
T'as lair de bien maitriser le sujet Klingsor.
Je reste dubitatif quant au fait que tu as fais le calcul de la 3ème question sous l'hyphotèse Hypergéométrique.
Utilises tu un programmes ?
Donc d'aprés ce que tu dis, à la question 4 il s'agirait de la loi Normal mais pour le déduire il faut utiliser le Théorème Central-Limite ?
c'est ce qu'on appelle une approximation de la loi binomiale par la loi normal ?
Le cours dit bien des choses, mais malheureusement quant à la raison d'utiliser telle ou telle loi, cela doit être présent mais pas dans mon langage. Aïe
Tout ce que je comprend maintenant, c'est qu'en fonction de la taille de l'échantillon et de la population, il y aura des disparités selon les formules donc il y a bien des formules adéquates à un moment particuliers mais ces points dans le cours je ne les trouve pas car c'est un peu une suite de formule avec leur titre.
Citation : Pour l’enquête on tire 200 personnes |
Alors pour un petit échantillon avec remise, on peut utiliser la loi Binomiale mais pour un plus grand échantillon avec remise, j'utilise la loi Normal car les valeurs seront plus précises mais pour déduire si je peux utiliser la loi Normal il faut passer par le Théorème Central-Limite et notemment ces conditions suivantes :
Pour ce faire je m'appuie sur une estimation connu et représentatif de p qui est 0,2
n=200
p=0,2
q=1-0,2
soit n.p = 40 et n.q = 160
je peux donc utiliser une approximation de la loi Binomiale par la loi Normal
de paramètre N(40 ; 5,656)
et là c'est le drame parce que je retrouve pas la même chose que toi
Marsh Posté le 05-03-2012 à 21:44:03
Positiviste a écrit : Je reste dubitatif quant au fait que tu as fais le calcul de la 3ème question sous l'hyphotèse Hypergéométrique. |
Excel le fait très bien (même si j'ai utilisé un autre programme)
Positiviste a écrit : |
Pas exactement. Il y a une approximation de la Binomiale B(n,p) par la Normale N(np,np(1-p)) qui est valide si np est "pas trop petit" ; mais le Théorème Central Limite traite de la distribution d'une moyenne dans un échantillon ; et vaut quasiment quelque soit la distribution initiale.
Positiviste a écrit :
|
Comme dit plus haut, l'approximation Normale de la Binomiale vaut si np pas trop petit, mais c'est une approximation de la distribution du nombre de 1 parmi n tirages, pas de la distribution de la proportion de 1 dans un échantillon de taille n. ceci dit les deux approches donneront la même chose :
Notations :
X= nombre de 1 dans l'échantillon de taille n
Y = proportion de 1 sans l'échantillon de taille n = X/n
Je note la Normale N(mu, sigma^2) où mu est l'espérance, et sigma^2 la variance de la loi (tu notes N(mu,sigma) c'est-à-dire avec l'écart-type au lieu de la variance)
- Via l'approximation normale
X~N(np,np(1-p))
X/n = Y~N(np/p,p(1-p)/n)
Y~N(p,p(1-p)/n)
avec p=0.2, n=200, on a Y~N(0.2,0.0008)
- Via le théorème Central-Limite
rappel, si Z suit une loi d'espérance m et de variance s^2, alors la moyenne des observations de Z sur un échantillon de taille n suit approximativement une N(m, s^2/n). L'approxiamtion est d'autant meilleure que la taille de l'échantillon est grand, mais le théorème ne dépend pas de la loi initiale de Z, pourvu que s^2 ne soit pas infini.
du coup, on a bien que Y est la moyenne d'une Bernouilli B(p) calculée sur un échantillon de taille n
et Y~N(p,p(1-p)/n)
soit Y~N(0.2,0.0008)
Par ailleurs, l'approximation Normale n'est qu'une approximation, et n'est donc pas plus précise, juste plus pratique à calculer/utiliser pour des choses plus complexes par la suite.
Marsh Posté le 08-03-2012 à 10:35:53
Ou la la c'est pas gagner
Je viens de trouver ce que tu viens de m'expliquer dans le cours mais j'avais aussi utilisé le cours.
La partie que j'ai utilisé du cours :
La partie que tu as utilisé présent dans le cours :
-----------------
Jvais peux être paraitre lourd mais je ne sais pas distingué les raisons d'utilisation de l'un et de l'autre.
une fois il est dit çà :
Puis aprés çà :
Marsh Posté le 08-03-2012 à 17:04:45
Sans trop rentrer dans les détails, historiquement l'approximation normale de la Binomiale (ou plutôt la convergence de la binomiale vers la normale quand n augmente) a été démontrée en premier (Théorème de De Moivre-Laplace). En fait on peut le voir comme un cas particulier d'un théorème central-limite (TCL)
Le TCL dit qu'une moyenne de variables aléatoires d'espérance m et de variance s^2 converge vers une Normale d'espérance m et de variance s^2/n où n est la taille de l'échantillon sur lequel se calcule cette moyenne.
Une moyenne n'est rien d'autre qu'une somme divisée par n. Donc le TCL dit également qu'une somme va converger vers une Normale N(nm,ns^2)
Or une binomale B(n,p) n'est rien d'autre qu'une somme de n Bernoulli B(p) (d'espérance p, et de variance p(1-p)), et donc on a bien que la Binomiale B(n,p) va converger vers une N(np,np(1-p))
Si on prend la fréquence de succès, soit la moyenne de la Bernoulli B(p) sur un échantillon de taille n ; ou encore la Binomiale B(n,p) divisé par n, on a bien que ça va converger vers une N(p, p(1-p)/n)
Marsh Posté le 03-03-2012 à 12:36:28
Bonjour,
J'ai un peu de mal avec les statistique.
Je planche sur un exercice mais je ne sais pas à un moment donné quelle loi utiliser et donc les raisons du choix de cette loi.
Voici une patie de l'exercice :
ans une ville de 100 000 habitants, on sait grâce au Recensement de la population que 20% des habitants vivent dans l’hyper centre.
1. Combien de personnes vivant dans l’hyper centre, un échantillon de 10 personnes « parfait » devrait contenir ?
2. Quelle loi suit le nombre de personnes vivant dans l’hyper centre dans un échantillon de taille 10 ? Calculer l’espérance mathématique et l’écart type de cette loi.
Réponses :
1) 2 personnes vivent dans l'hypercentre sur un échantillon parfait de 10 personnes.
2) J'identifie une loi de Bernoulli car il y a deux issues :
- vit dans l'hypercentre
- ne vit pas dans l'hypercentre
de paramètre L(X)= B(1 ; p)
soit :
L(X)= B(1 ; 0,2)
E(X)=0,2
Var(X) = p.q = 0,2 . 0,8 = 0,16
écart type (X) = 0,4
Dans un échantillon de taille 10, on peut éspérer avoir 2 habitants vivant dans l'hypercentre avec une dispersion de 0,4
Mais cela me parait douteux je ne sais pas pourquoi.
Message édité par Positiviste le 03-03-2012 à 12:38:03
---------------
ploum ploum tralala