Υπεργεωμετρική κατανομή

Από testwiki
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση
Αρχείο:Urn hypergeometric.svg
Παράδειγμα δείγματος από την υπεργεωμετρική κατανομή με N=22, K=11 και n=3. Παρατηρήστε ότι η δειγματοληψία γίνεται χωρίς επανατοποθέτηση.
Συνάρτηση μάζας πιθανότητας για τηυ υπεργεωμετρική κατανομή με N=100, n=25 και K=10,30,60.
Αθροιστική συνάρτηση κατανομής για τη υπεργεωμετρική κατανομή με N=100, n=25 και K=10,30,60..
Υπεργεωμετρική Κατανομή
Συμβολισμός 𝖧(N,K,n)
Παράμετροι

N (το μέγεθος του πληθυσμού)
K{0,1,,N} (το πλήθος των επιτυχιών)
n{0,1,,N} (το πλήθος των δειγμάτων)

Φορέας k{max(0,n+KN),,min(n,k)}
Συνάρτηση Μάζας
Πιθανότητας
(Kk)(NKnk)(Nn)
Μέσος nKN
Επικρατούσα τιμή (n+1)(K+1)N+21, (n+1)(K+1)N+2
Διακύμανση nKNNKNNnN1

Η υπεργεωμετρική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής που δίνει το πλήθος των επιτυχιών σε n δείγματα (χωρίς επανάληψη) σε έναν πεπερασμένο πληθυσμό μεγέθους N, εκ των οποίων τα K είναι επιτυχίες.

Η κατανομή γίνεται εύκολα κατανοητή με την περιγραφή της μέσω ενός μοντέλου με κάλπες. Θεωρούμε μια κάλπη με K πράσινες μπάλες (επιτυχίες) και NK κόκκινες (αποτυχίες). Από την κάλπη παίρνουμε χωρίς επανατοποθέτηση n μπάλες. Η υπεργεωμετρική κατανομή μας δίνει την πιθανότητα k από αυτές να είναι πράσινες.

Ορισμός

Η πιθανότητα να υπάρχουν k{max(0,n+KN),,min(n,k)} επιτυχίες είναι:[1][2][3][4]

P(X=k)=(Kk)(NKnk)(Nn),

όπου (xy) είναι ο διωνυμικός συντελεστής.

Από την ταυτότητα Βαντερμόντ προκύπτει ότι ο παραπάνω ορισμός δίνει μία έγκυρη συνάρτηση πιθανότητας.

Παραδείγματα

Παράδειγμα 1ο

Αν έχουμε N=6 μπάλες εκ των οποίων οι K=2 είναι πράσινες, τότε οι πιθανότητες να διαλέξουμε k=0,1,2 πράσινες σε δύο δείγματα δίνονται ως εξής:

Πλήθος επιτυχιών Δείγματα Πιθανότητα
X=0

R1R2 R1R3 R1R4
R2R3 R2R4
R3R4

615
X=1

Π1R1 Π2R1
Π1R2 Π2R2
Π1R3 Π2R3
Π1R4 Π2R4

815
X=2 Π1Π2 115

Παράδειγμα 2ο

Για X𝖧(22,11,3) έχουμε ότι

P(X=2)=(112)(111)(222)=1184.


Μέση τιμή

Έστω X𝖧(N,K,n), τότε μπορούμε να γράψουμε X=i=1nXi, όπου Xi είναι η δείκτρια τυχαία μεταβλητή για το γεγονός

i={ Το i-οστό δείγμα ήταν επιτυχία}.

Αφού υπάρχουν K επιτυχίες συνολικά, έχουμε ότι

P(i)=KN.

Από την γραμμικότητα της αναμενόμενης τιμής, έχουμε ότι

E[X]=E[i=1nXi]=i=1nE[Xi]=nKN.

Διακύμανση

Όπως και για την μέση τιμή, γράφουμε X=i=1nXi. Τότε από την ταυτότητα Bienaymé, έχουμε για την διακύμανση ότι

Για την διακύμανση, από την κατανομή Μπερνούλλι, έχουμε ότι

Πρότυπο:NumBlk

Για την συνδιακύμανση, έχουμε ότι

Cov[Xi,Xj]=E[XiXj]E[Xi]E[Xj].

Για τον πρώτο όρο, έχουμε

E[XiXj]=E[Xi|Xj=1]P(Xj=1)=K1N1kN.

Επομένως,

Cov[Xi,Xj]=KNKNK1N1KN=KN(KNK1N1)=K(NK)N2(N1).

Επιστρέφοντας στην (Πρότυπο:EquationNote), λαμβάνουμε ότι

Var[X]=nKN(1KN)+n(n1)K(NK)N2(N1)=nKNNKNNnN1.

Επικρατούσα τιμή

Η επικρατούσα τιμή της κατανομής δίνεται από το v ή v1, όπου

v=(n+1)(K+1)N+2.

Ο λόγος είναι ότι P(X=k)>P(X=k1) αν και μόνο αν k<v, καθώς

P(X=k)P(X=k1)>1K!k!(Kk)!(NK)!(Nk)!(NKn+k)!K!(k1)!(Kk+1)!(NK)!(nk+1)!(NKn+k1)!>1Kk+1knk+1NKn+k>1k<(n+1)(K+1)N+2

Ανισότητες

Για X𝖧(N,K,n) έχουμε ότι για p=KN και κάθε t0,[5]

P(X(p+t)n)((pp+t)(1p1pt)1pt)ne2t2n.

Δείτε επίσης

Παραπομπές


Πρότυπο:Μαθηματικά-επέκταση