Πολυωνυμική κατανομή

Από testwiki
Αναθεώρηση ως προς 12:26, 18 Ιουνίου 2023 από τον imported>Dimitris131
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση
Πολυωνυμική Κατανομή
Παράμετροι n (πλήθος δειγμάτων)
k (πλήθος αποτελεσμάτων)
p1,,pk0 με i=1kpi=1.
Φορέας {(x1,,xk)ki=1kxi=n}
Συνάρτηση Μάζας
Πιθανότητας
n!x1!x2!xk!p1x1pkxk
Μέσος E[Xi]=npi
Διακύμανση V[Xi]=npi(1pi)
Cov(Xi,Xj)=npipj για ij
Εντροπία log2(n!)ni=1npilog2pi
+i=1kxi=0n(nxi)pixi(1p)nxilog2(xi!)
Πιθανογεννήτρια (i=1kpiti)n
Χαρακτηριστική (i=1kpieti)n

Στην θεωρία πιθανοτήτων και τη στατιστική, η πολυωνυμική κατανομή είναι η γενίκευση της διωνυμικής κατανομής, όπου υπάρχουν n επαναλήψεις ενός πειράματος με k πιθανά αποτελέσματα. Πιο συγκεκριμένα, δίνει την πιθανότητα για κάθε δυνατό πλήθος αποτελεσμάτων (x1,,xk)n.[1][2][3][4]

Ανάλυση παραμέτρων

Η πολυωνυμική κατανομή εξετάζει τη συνδυαστική πιθανότητα να συμβούν ταυτόχρονα μια σειρά από k ενδεχόμενα Ε1, Ε2, …, Εk, σε n επαναλήψεις μιας τυχαίας διαδικασίας, το καθένα εκ των οποίων έχει τη δική του πιθανότητα p1, p2, …, pk να πραγματοποιηθεί σε μία εκτέλεση της διαδικασίας. Συμβολίζουμε με x1, x2, …, xk, τον ακριβή αριθμό των φορών που ζητάμε να εμφανισθεί το κάθε ενδεχόμενο.

Ισχύουν οι παρακάτω σχέσεις:

i=1kpi=1 και i=1kxi=n


Η πιθανότητα να εμφανισθεί το κάθε ενδεχόμενο όσες φορές ακριβώς ορίσαμε, δίνεται από τον τύπο:

P(X1=x1,,Xn=xn)=n!x1!x2!xk!p1x1p2x2pkxk.

Παραδείγματα

Έστω ότι έχουμε ένα δοχείο με n=22 μπάλες, 9 κόκκινες, 7 μαύρες και 6 μπλε. Τότε αν διαλέξουμε k=3 μπάλες (με αντικατάσταση), τότε η κατανομή είναι πολυωνυμική με παραμέτρους

(p1,p2,p3)=(922,722,622),

και λαμβάνουμε τις εξής πιθανότητες για τα ενδεχόμενα:

Αποτέλεσμα Πιθανότητα
(3,0,0) 3!3!0!0!(922)30.0684
(0,3,0) 3!0!3!0!(722)30.0322
(0,0,3) 3!0!0!3!(622)30.0202
(1,2,0) 3!1!2!0!(922)1(722)20.0912
(1,0,2) 3!1!0!2!(922)1(622)20.1242
(2,1,0) 3!2!1!0!(922)2(722)10.159
(0,1,2) 3!0!1!2!(722)1(622)20.070
(2,0,1) 3!2!0!1!(922)2(622)10.136
(0,2,1) 3!0!2!1!(722)2(622)10.0828
(1,1,1) 3!1!1!1!(922)1(722)1(622)10.212
Δοχείο με 22 μπάλες εκ των οποίων οι 9 είναι κόκκινες, 7 μαύρες και 6 μπλε.

Πρότυπο:Clear

Η πολυωνυμική κατανομή μπορεί να χρησιμοποιηθεί για να μοντελοποιήσει τα εξής:[5]

  • Οι ταξιδιωτικοί προορισμοί των n κατοίκων της χώρας μας στο εσωτερικό με την κατηγοριοποίησή τους στους εξής k προορισμούς: Κυκλάδες, Σποράδες, Δωδεκάνησα, Επτάνησα, Ζαγοροχώρια, Ορεινή Ναυπακτία, Πήλιο, Αράχωβα και Καλάβρυτα.
  • Η εξέταση ανάπτυξης του κλάδου επιχειρήσεων ανάλογα με την γεωγραφική περιοχή και την μορφολογία του εδάφους, που μπορεί να είναι καλλιέργεια εσπεριδοειδών ή οσπρίων, δημιουργία φάρμας, εξόρυξη μετάλλων.

Μέση τιμή

Η περιθωριακή κατανομή του Xi είναι διωνυμική με παραμέτρους n και pi[0,1]. Επομένως, η μέση τιμή του Xi, δίνεται από τον τύπο

E[Xi]=npi.

Διακύμανση

Αντίστοιχα, η διακύμανση του Xi δίνεται από τον τύπο

V[Xi]=npi(1pi).

Συνδιακύμανση

Από τον ορισμό της συνδιακύμανσης για Xi και Xj με ij, έχουμε ότι

Cov(Xi,Xj)=E[XiXj]E[Xi]E[Xj].

Από τον νόμο της ολικής πιθανότητας, και αφού η τυχαία μεταβλητή Y=(XiXj=k) είναι 𝖡𝗂𝗇(nk,pi/(1pj)), έχουμε ότι

E[XiXj]=k=0nE[XiXj=k]P(Xj=k)=k=0n(nk)pi1pjk(nk)pjk(1pj)nk=k=0n(nk)pi1pjk(nk)pjk(1pj)nk=npi1pjk=0n(nk)pjk(1pj)nkpi1pjk=0n(nk)pjk(1pj)nkk=npi1pjk=0nP(Xj=k)kpik=0nP(Xj=k)k2=npi1pj(npj+n(n1)pj2+npj)=n2pipjnpipj.

Επομένως,

Cov(Xi,Xj)=n2pipjnpipjn2pipj=npipj.

Δείτε επίσης

Παραπομπές