Πολυμεταβλητή κανονική κατανομή

Από testwiki
Αναθεώρηση ως προς 09:38, 12 Μαρτίου 2025 από τον imported>InternetArchiveBot (Προσθήκη 3 βιβλίων για Επαληθευσιμότητα (20250311sim)) #IABot (v2.0.9.5) (GreenC bot)
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση
Πολλά δειγματοληπτικά σημεία από μια πολυμεταβλητή κανονική κατανομή με μ=[00] and Σ=[13/53/52], που απεικονίζεται μαζί με την έλλειψη 3-sigma, τις δύο οριακές κατανομές και τα δύο ιστογράμματα 1-d.

Στη θεωρία πιθανοτήτων και τη στατιστική, η πολυμεταβλητή κανονική κατανομή, η πολυμεταβλητή Γκαουσιανή κατανομή ή η κοινή κανονική κατανομή είναι μια γενίκευση της μονοδιάστατης κανονικής κατανομής σε υψηλότερες διαστάσεις. Σύμφωνα με τον ορισμό, ένα τυχαίο διάνυσμα λέγεται ότι έχει k-μεταβλητή κανονική κατανομή εάν κάθε γραμμικός συνδυασμός των k συνιστωσών του έχει μονομεταβλητή κανονική κατανομή. Η σημασία του προκύπτει κυρίως από το πολυμεταβλητό κεντρικό οριακό θεώρημα. Η πολυμεταβλητή κανονική κατανομή χρησιμοποιείται συχνά για να περιγράψει, τουλάχιστον κατά προσέγγιση, οποιοδήποτε σύνολο (ενδεχομένως) συσχετιζόμενων τυχαίων μεταβλητών πραγματικής τιμής, κάθε μία από τις οποίες συσσωρεύεται γύρω από μια μέση τιμή.

Ορισμοί

Συμβολισμός και παραμετροποίηση

Η πολυμεταβλητή κανονική κατανομή ενός k-διάστατου τυχαίου διανύσματος 𝐗=(X1,,Xk)T μπορεί να γραφεί με τον ακόλουθο συμβολισμό:

𝐗  𝒩(μ,Σ),

ή να γίνει ρητά γνωστό ότι το 𝐗 είναι k-διάστατο,

𝐗  𝒩k(μ,Σ),

με k-διάστατο μέσο διάνυσμα

μ=E[𝐗]=(E[X1],E[X2],,E[Xk])T,

και k×k πίνακα συνδιακύμανσης

Σi,j=E[(Xiμi)(Xjμj)]=Cov[Xi,Xj]

έτσι ώστε 1ik and 1jk.

Ο αντίστροφος του πίνακα συνδιακύμανσης ονομάζεται πίνακας ακρίβειας και συμβολίζεται με 𝑸=Σ1.

Τυπικό κανονικό τυχαίο διάνυσμα

Ένα πραγματικό τυχαίο διάνυσμα 𝐗=(X1,,Xk)T ονομάζεται τυπικό κανονικό τυχαίο διάνυσμα αν όλες οι συνιστώσες του Xi είναι ανεξάρτητες και κάθε μία είναι μια κανονικά κατανεμημένη τυχαία μεταβλητή με μοναδιαία διακύμανση μηδενικού μέσου, δηλαδή αν Xi 𝒩(0,1) για όλα τα i=1k.[1]Πρότυπο:Rp

Κεντρικό κανονικό τυχαίο διάνυσμα

Ένα πραγματικό τυχαίο διάνυσμα 𝐗=(X1,,Xk)T ονομάζεται κεντρικό κανονικό τυχαίο διάνυσμα αν υπάρχει ένας k× πίνακας 𝑨 τέτοιος ώστε 𝑨𝐙 έχει την ίδια κατανομή με το 𝐗 όπου 𝐙 είναι ένα τυπικό κανονικό τυχαίο διάνυσμα με συνιστώσες.[1]Πρότυπο:Rp

Κανονικό τυχαίο διάνυσμα

Ένα πραγματικό τυχαίο διάνυσμα 𝐗=(X1,,Xk)T ονομάζεται κανονικό τυχαίο διάνυσμα αν υπάρχει ένα τυχαίο -διάνυσμα 𝐙, το οποίο είναι ένα τυπικό κανονικό τυχαίο διάνυσμα, έναk-διάνυσμα μ, και ένας k× πίνακας 𝑨, τέτοιος ώστε 𝐗=𝑨𝐙+μ.[2]Πρότυπο:Rp[1]Πρότυπο:Rp

Τυπικά:

𝐗  𝒩k(μ,Σ)there exist μk,𝑨k× such that 𝐗=𝑨𝐙+μ and n=1,,:Zn 𝒩(0,1),i.i.d.

Ο πίνακας συνδιακύμανσης είναι Σ=𝑨𝑨T.

Στην εκφυλισμένη περίπτωση όπου ο πίνακας συνδιακύμανσης είναι ιδιάζων, η αντίστοιχη κατανομή δεν έχει πυκνότητα- δείτε την ενότητα παρακάτω για λεπτομέρειες. Αυτή η περίπτωση εμφανίζεται συχνά στη στατιστική- επί παραδείγματι, στην κατανομή του διανύσματος των καταλοίπων στη συνήθη παλινδρόμηση ελαχίστων τετραγώνων. Οι Xi δεν είναι γενικά ανεξάρτητες- μπορούν να θεωρηθούν ως το αποτέλεσμα της εφαρμογής του πίνακα 𝑨 σε μια συλλογή ανεξάρτητων γκαουσιανών μεταβλητών 𝐙.

Ισοδύναμοι ορισμοί

Οι ακόλουθοι ορισμοί είναι ισοδύναμοι με τον ορισμό που δίνεται παραπάνω. Ένα τυχαίο διάνυσμα 𝐗=(X1,,Xk)T έχει πολυμεταβλητή κανονική κατανομή εάν ικανοποιεί μία από τις ακόλουθες ισοδύναμες συνθήκες.

  • Κάθε γραμμικός συνδυασμός Y=a1X1++akXk των συνιστωσών του είναι κανονικά κατανεμημένος. Δηλαδή, για κάθε σταθερό διάνυσμα 𝐚k, η τυχαία μεταβλητή Y=𝐚T𝐗 έχει μονοδιάστατη κανονική κατανομή, όπου μια μονοδιάστατη κανονική κατανομή με μηδενική διακύμανση είναι μια σημειακή μάζα στη μέση τιμή της.
  • Υπάρχει ένα k-διάνυσμα μ και ένας συμμετρικός, θετικά ημιτελής k×k πίνακας Σ, τέτοιος ώστε η χαρακτηριστική συνάρτηση του 𝐗 να είναι φ𝐗(𝐮)=exp(i𝐮Tμ12𝐮TΣ𝐮).

Η σφαιρική κανονική κατανομή μπορεί να χαρακτηριστεί ως η μοναδική κατανομή στην οποία οι συνιστώσες είναι ανεξάρτητες σε οποιοδήποτε ορθογώνιο σύστημα συντεταγμένων.[3][4]

Συνάρτηση πυκνότητας

Διμεταβλητή κανονική κοινή πυκνότητα

Μη εκφυλισμένη περίπτωση

Η πολυμεταβλητή κανονική κατανομή λέγεται «μη εκφυλισμένη» όταν ο συμμετρικός πίνακας συνδιακύμανσης Σ είναι θετικά ορισμένος. Στην περίπτωση αυτή η κατανομή έχει πυκνότητα[5]

f𝐗(x1,,xk)=exp(12(𝐱μ)TΣ1(𝐱μ))(2π)k|Σ|

όπου 𝐱 είναι ένα πραγματικό k-διάστατο διάνυσμα στήλης και |Σ|detΣ είναι ο προσδιοριστής του Σ, επίσης γνωστός ως γενικευμένη διακύμανση. Η παραπάνω εξίσωση ανάγεται σε εκείνη της μονομεταβλητής κανονικής κατανομής εάν Σ είναι ένας πίνακας 1×1 (δηλαδή ένας απλός πραγματικός αριθμός).

Η κυκλικά συμμετρική εκδοχή της μιγαδικής κανονικής κατανομής έχει ελαφρώς διαφορετική μορφή.

Κάθε τόπος ισο-πυκνότητας - ο τόπος των σημείων στον k-διάστατο χώρο, καθένα από τα οποία δίνει την ίδια συγκεκριμένη τιμή της πυκνότητας - είναι μια έλλειψη ή η υψηλότερης διάστασης γενίκευσή της- επομένως η πολυμεταβλητή κανονική είναι μια ειδική περίπτωση των ελλειπτικών κατανομών.

Η ποσότητα (𝐱μ)TΣ1(𝐱μ) είναι γνωστή ως απόσταση Μαχαλανόμπις, η οποία αντιπροσωπεύει την απόσταση του σημείου δοκιμής 𝐱 από τη μέση τιμή μ. Η τετραγωνική απόσταση Μαχαλανόμπις

(𝐱μ)TΣ1(𝐱μ) αναλύεται σε ένα άθροισμα k όρων, όπου κάθε όρος είναι γινόμενο τριών σημαντικών συνιστωσών.[6]

Ας σημειωθεί ότι στην περίπτωση που k=1, η κατανομή ανάγεται σε μονομεταβλητή κανονική κατανομή και η απόσταση Μαχαλανόμπις ανάγεται στην απόλυτη τιμή της τυπικής βαθμολογίας. Βλέπε επίσης Διάστημα παρακάτω.

Διδάστατη περίπτωση

Στη διδιάστατη μη-ιδιάζουσα περίπτωση (k=rank(Σ)=2), η συνάρτηση πυκνότητας πιθανότητας ενός διανύσματος [XY] είναι:

f(x,y)=12πσXσY1ρ2exp(12[1ρ2][(xμXσX)22ρ(xμXσX)(yμYσY)+(yμYσY)2])

όπου ρ είναι η συσχέτιση μεταξύ X και Y και

μ=(μXμY),Σ=(σX2ρσXσYρσXσYσY2).

Στη διμεταβλητή περίπτωση, η πρώτη ισοδύναμη συνθήκη για την πολυμεταβλητή ανακατασκευή της κανονικότητας μπορεί να γίνει λιγότερο περιοριστική, καθώς αρκεί να επαληθεύσουμε ότι ένα μετρήσιμο άπειρο σύνολο διαφορετικών γραμμικών συνδυασμών των X και Y είναι κανονικοί για να συμπεράνουμε ότι το διάνυσμα [XY] είναι διμεταβλητό κανονικό.[7]

Οι διμεταβλητοί τόποι ισοπυκνότητας που απεικονίζονται στο επίπεδο x,y είναι ελλείψεις, των οποίων οι κύριοι άξονες ορίζονται από τα ιδιοδιανύσματα του πίνακα συνδιακύμανσης Σ (η μείζων και η ελάσσων ημιδιαμέτρος της έλλειψης ισούνται με την τετραγωνική ρίζα των διατεταγμένων ιδιοτιμών).

Διμεταβλητή κανονική κατανομή με κέντρο (1,3) και τυπική απόκλιση 3 περίπου στην κατεύθυνση (0,878,0,478) και 1 στην ορθή κατεύθυνση.

Καθώς η απόλυτη τιμή της παραμέτρου συσχέτισης ρ αυξάνεται, οι θέσεις αυτές συμπιέζονται προς την ακόλουθη γραμμή :

y(x)=sgn(ρ)σYσX(xμX)+μY.

Αυτό συμβαίνει επειδή η έκφραση αυτή, με την αντικατάσταση της sgn(ρ) (όπου sgn είναι η συνάρτηση προσήμου) από την ρ, είναι η καλύτερη γραμμική αμερόληπτη πρόβλεψη της Y δεδομένης μιας τιμής της X.[8]

Εκφυλισμένη περίπτωση

Εάν ο πίνακας συνδιακύμανσης Σ δεν είναι πλήρους τάξης, τότε η πολυμεταβλητή κανονική κατανομή είναι εκφυλισμένη και δεν έχει πυκνότητα. Πιο συγκεκριμένα, δεν έχει πυκνότητα ως προς το k -διάστατο μέτρο Lebesgue (το οποίο είναι το συνηθισμένο μέτρο που θεωρείται στα μαθήματα πιθανοτήτων επιπέδου μαθηματικών). Μόνο τα τυχαία διανύσματα των οποίων οι κατανομές είναι απολύτως συνεχείς ως προς ένα μέτρο λέγεται ότι έχουν πυκνότητα (ως προς αυτό το μέτρο). Για να μιλήσουμε για πυκνότητες, αλλά να αποφύγουμε να ασχοληθούμε με θεωρητικές περιπλοκές του μέτρου, μπορεί να είναι απλούστερο να περιορίσουμε την προσοχή σε ένα υποσύνολο rank(Σ) των συντεταγμένων του 𝐱 τέτοιο ώστε ο πίνακας συνδιακύμανσης για αυτό το υποσύνολο να είναι θετικά ορισμένος- τότε οι άλλες συντεταγμένες μπορούν να θεωρηθούν ως μια αφινική συνάρτηση αυτών των επιλεγμένων συντεταγμένων.[9]

Επομένως, για να μιλήσουμε για πυκνότητες με νόημα σε μεμονωμένες περιπτώσεις, πρέπει να επιλέξουμε ένα διαφορετικό μέτρο βάσης. Χρησιμοποιώντας το θεώρημα αποσύνθεσης μπορούμε να ορίσουμε έναν περιορισμό του μέτρου Λεμπέσγκ στον rank(Σ)-διάστατο affine υποχώρο του k όπου υποστηρίζεται η κατανομή Γκάους, i. δηλ. {μ+Σ1/2𝐯:𝐯 ink}. Ως προς αυτό το μέτρο η κατανομή έχει την πυκνότητα του ακόλουθου μοτίβου:

f(𝐱)=exp(12(𝐱μ)TΣ+(𝐱μ))det\nolimits *(2πΣ)

όπου Σ+ είναι το γενικευμένο αντίστροφο και det\nolimits * είναι ο ψευδο-προσδιοριστής.[10]

Αθροιστική συνάρτηση κατανομής

Η έννοια της αθροιστικής συνάρτησης κατανομής (cdf) στη διάσταση 1 μπορεί να επεκταθεί με δύο τρόπους στην πολυδιάστατη περίπτωση, με βάση ορθογώνιες και ελλειψοειδείς περιοχές.

Ο πρώτος τρόπος είναι να οριστεί η cdf F(𝐱) ενός τυχαίου διανύσματος 𝐗 ως η πιθανότητα όλες οι συνιστώσες του 𝐗 να είναι μικρότερες ή ίσες με τις αντίστοιχες τιμές στο διάνυσμα 𝐱:[11]

F(𝐱)=(𝐗𝐱),where 𝐗𝒩(μ,Σ).

Παρόλο που δεν υπάρχει κλειστή μορφή για την F(𝐱), υπάρχει ένας αριθμός αλγορίθμων που την εκτιμούν αριθμητικά.[11][12]

Ένας άλλος τρόπος είναι να ορίσουμε το cdf F(r) ως την πιθανότητα ένα δείγμα να βρίσκεται εντός του ελλειψοειδούς που καθορίζεται από την απόσταση Μαχαλανόμπις r από την Γκαουσιανή, μια άμεση γενίκευση της τυπικής απόκλισης.[13]

Για τον υπολογισμό των τιμών αυτής της συνάρτησης υπάρχουν κλειστοί αναλυτικοί τύποι,[13] ως εξής.

Διάστημα

Επάνω: η πιθανότητα ενός διμεταβλητού κανονικού στην περιοχή xsinyycosx>1 (μπλε περιοχές). Μέση: η πιθανότητα μιας τριμεταβλητής κανονικής σε ένα τοροειδές πεδίο. Κάτω: συγκλίνον ολοκλήρωμα Μόντε-Κάρλο της πιθανότητας μιας 4-μεταβλητής κανονικής στο 4d κανονικό πολυεδρικό πεδίο που ορίζεται από την i=14|xi|<1. Όλα αυτά υπολογίζονται με την αριθμητική μέθοδο της ανίχνευσης ακτίνων.[14]

Το διάστημα για την πολυμεταβλητή κανονική κατανομή δίνει μια περιοχή που αποτελείται από εκείνα τα διανύσματα x που ικανοποιούν

(𝐱μ)TΣ1(𝐱μ)χk2(p).

Εδώ 𝐱 είναι ένα k-διάστατο διάνυσμα, μ είναι το γνωστό k-διάστατο μέσο διάνυσμα, Σ είναι ο γνωστός πίνακας συνδιακύμανσης και χk2(p) είναι η συνάρτηση ποσοστηρίου για την πιθανότητα p της κατανομής χι-τετράγωνο (chi-squared) με k βαθμούς ελευθερίας. [15] Όταν k=2, η έκφραση ορίζει το εσωτερικό μιας έλλειψης και η κατανομή χι-τετράγωνο απλοποιείται σε μια εκθετική κατανομή με μέση τιμή ίση με δύο (ποσοστό ίσο με το μισό).

Συμπληρωματική αθροιστική συνάρτηση κατανομής (κατανομή ουράς)

Η συμπληρωματική αθροιστική συνάρτηση κατανομής (ccdf) ή η κατανομή ουράς

ορίζεται ως F(𝐱)=1(𝐗𝐱).

όταν 𝐗𝒩(μ,Σ), τότε το ccdf μπορεί να γραφεί ως πιθανότητα το μέγιστο των εξαρτημένων γκαουσιανών μεταβλητών:[16]

F(𝐱)=(i{Xixi})=(maxiYi0),where 𝐘𝒩(μ𝐱,Σ).

Αν και δεν υπάρχει απλός κλειστός τύπος για τον υπολογισμό του ccdf, το μέγιστο των εξαρτημένων γκαουσιανών μεταβλητών μπορεί να εκτιμηθεί με ακρίβεια μέσω της μεθόδου Μόντε Κάρλο.[16][17]

Ιδιότητες

Πιθανότητα σε διάφορους τομείς

Το περιεχόμενο πιθανότητας της πολυμεταβλητής κανονικής σε ένα τετραγωνικό πεδίο που ορίζεται από τη σχέση q(𝒙)=𝒙𝐐𝟐𝒙+𝒒1𝒙+q0>0 (όπου 𝐐𝟐 είναι ένας πίνακας, 𝒒1 είναι ένα διάνυσμα, και q0 είναι ένα κλιμάκιο), η οποία είναι σχετική με τη θεωρία Μπέιζιαν ταξινόμησης/αποφάσεων που χρησιμοποιεί την ανάλυση διάκρισης Γκάους, δίνεται από τη γενικευμένη κατανομή χι-τετράγωνο.[14]

Το περιεχόμενο πιθανότητας εντός οποιουδήποτε γενικού πεδίου που ορίζεται από την f(𝒙)>0 (όπου f(𝒙) είναι μια γενική συνάρτηση) μπορεί να υπολογιστεί με τη χρήση της αριθμητικής μεθόδου της ανίχνευσης ακτίνων [14](Matlab code).

Υψηλότερες ροπές

Οι ροπές k τάξης του x δίνονται από

μ1,,N(𝐱)=defμr1,,rN(𝐱)=defE[j=1NXjrj]

όπου Πρότυπο:Math

Οι κεντρικές ροπές k τάξης είναι οι ακόλουθες

Αν k είναι περιττό, Πρότυπο:Math. Αν k είναι άρτιο με Πρότυπο:Math, τότε

μ1,,2λ(𝐱μ)=(σijσkσXZ)

όπου το άθροισμα λαμβάνεται σε όλες τις κατανομές του συνόλου {1,,2λ} σε λ (μη διατεταγμένα) ζεύγη. Δηλαδή, για μια kth κεντρική στιγμή Πρότυπο:Math, αθροίζουμε τα γινόμενα των Πρότυπο:Nowrap συνδιακυμάνσεις (η αναμενόμενη τιμή μ λαμβάνεται 0 για λόγους λιτότητας):

E[X1X2X3X4X5X6]=E[X1X2]E[X3X4]E[X5X6]+E[X1X2]E[X3X5]E[X4X6]+E[X1X2]E[X3X6]E[X4X5]+E[X1X3]E[X2X4]E[X5X6]+E[X1X3]E[X2X5]E[X4X6]+E[X1X3]E[X2X6]E[X4X5]+E[X1X4]E[X2X3]E[X5X6]+E[X1X4]E[X2X5]E[X3X6]+E[X1X4]E[X2X6]E[X3X5]+E[X1X5]E[X2X3]E[X4X6]+E[X1X5]E[X2X4]E[X3X6]+E[X1X5]E[X2X6]E[X3X4]+E[X1X6]E[X2X3]E[X4X5]+E[X1X6]E[X2X4]E[X3X5]+E[X1X6]E[X2X5]E[X3X4].

Αυτό δίνει (2λ1)!2λ1(λ1)! όρους στο άθροισμα (15 στην παραπάνω περίπτωση), καθένας από τους οποίους είναι το γινόμενο των λ (σε αυτή την περίπτωση 3) συνδιακυμάνσεων. Για ροπές τέταρτης τάξης (τέσσερις μεταβλητές) υπάρχουν τρεις όροι. Για ροπές έκτης τάξης υπάρχουν Πρότυπο:Math όροι, και για ροπές όγδοης τάξης υπάρχουν Πρότυπο:Math όροι.

Οι συνδιακυμάνσεις προσδιορίζονται στη συνέχεια με την αντικατάσταση των όρων του καταλόγου [1,,2λ] με τους αντίστοιχους όρους του καταλόγου που αποτελείται από r1 μονάδες, στη συνέχεια r2 δυάδες, κ.λπ. Για να το καταδείξετε αυτό, εξετάστε την ακόλουθη περίπτωση κεντρικής ροπής 4ης τάξης:

E[Xi4]=3σii2E[Xi3Xj]=3σiiσijE[Xi2Xj2]=σiiσjj+2σij2E[Xi2XjXk]=σiiσjk+2σijσikE[XiXjXkXn]=σijσkn+σikσjn+σinσjk.

όπου σij είναι η συνδιακύμανση των Xi και Xj. Με την παραπάνω μέθοδο βρίσκει κανείς πρώτα τη γενική περίπτωση για μια kth ροπή με k διαφορετικές μεταβλητές X, E[XiXjXkXn], και στη συνέχεια την απλοποιεί αναλόγως. Επί παραδείγματι, για την E[Xi2XkXn], αφήνουμε Πρότυπο:Math και χρησιμοποιούμε το γεγονός ότι σii=σi2.

Συναρτήσεις ενός κανονικού διανύσματος

a: Πυκνότητα πιθανότητας μιας συνάρτησης cosx2 μιας απλής κανονικής μεταβλητής x με μ=2 και σ=3. b: Πυκνότητα πιθανότητας μιας συνάρτησης xy ενός κανονικού διανύσματος (x,y), με μέση τιμή μ=(1,2), και συνδιακύμανση Σ=[.01.016.016.04]. c: Χάρτης θερμότητας της κοινής πυκνότητας πιθανότητας δύο συναρτήσεων ενός κανονικού διανύσματος (x,y), με μέση τιμή μ=(2,5), και συνδιακύμανση Σ=[107710]. d: Πυκνότητα πιθανότητας μιας συνάρτησης i=14|xi| από 4 iid τυπικές κανονικές μεταβλητές. Αυτές υπολογίζονται με την αριθμητική μέθοδο της ανίχνευσης ακτίνων.[14]

Μια τετραγωνική μορφή ενός κανονικού διανύσματος 𝒙, q(𝒙)=𝒙𝐐𝟐𝒙+𝒒1𝒙+q0 (όπου 𝐐𝟐 είναι ένας πίνακας, 𝒒1 είναι ένα διάνυσμα και q0 είναι ένα κλιμάκιο), είναι μια γενικευμένη μεταβλητή chi-squared.[14] Η κατεύθυνση ενός κανονικού διανύσματος ακολουθεί μια προβαλλόμενη κανονική κατανομή.[18]

Εάν f(𝒙) είναι μια γενική βαθμωτή συνάρτηση ενός κανονικού διανύσματος, η συνάρτηση πυκνότητας πιθανότητας, η αθροιστική συνάρτηση κατανομής και η αντίστροφη αθροιστική συνάρτηση κατανομής μπορούν να υπολογιστούν με την αριθμητική μέθοδο της ανίχνευσης ακτίνων (Matlab code).[14]

Συνάρτηση πιθανοφάνειας

Εάν ο μέσος όρος και ο πίνακας συνδιακύμανσης είναι γνωστά, η λογαριθμική πιθανότητα ενός παρατηρούμενου διανύσματος 𝒙 είναι απλώς το λογάριθμο της συνάρτησης πυκνότητας πιθανότητας:

lnL(𝒙)=12[ln(|Σ|)+(𝒙μ)Σ1(𝒙μ)+kln(2π)],

Η κυκλικά συμμετρική εκδοχή της μη κεντρικής περίπτωσης του μιγαδικού, όπου 𝒛 είναι ένα διάνυσμα μιγαδικών αριθμών, θα είναι

lnL(𝒛)=ln(|Σ|)(𝒛μ)Σ1(𝒛μ)kln(π)

δηλ. με τη συζυγή μεταφορά (που υποδεικνύεται με ) να αντικαθιστά την κανονική μεταφορά (που υποδεικνύεται με ). Αυτό είναι ελαφρώς διαφορετικό από ό,τι στην πραγματική περίπτωση, επειδή η κυκλικά συμμετρική εκδοχή της μιγαδικής κανονικής κατανομής έχει ελαφρώς διαφορετική μορφή για τη σταθερά κανονικοποίησης.

Ένας παρόμοιος συμβολισμός χρησιμοποιείται για την πολλαπλή γραμμική παλινδρόμηση.[19]

Δεδομένου ότι η λογαριθμική πιθανότητα ενός κανονικού διανύσματος είναι μια τετραγωνική μορφή του κανονικού διανύσματος, κατανέμεται ως μια γενικευμένη μεταβλητή χι-τετραγώνου.[14]

Διαφορική εντροπία

Η διαφορική εντροπία της πολυμεταβλητής κανονικής κατανομής είναι [20]

h(f)=f(𝐱)lnf(𝐱)d𝐱=12ln|2πeΣ|=k2+k2ln2π+12ln|Σ|,

όπου οι ράβδοι υποδηλώνουν τον προσδιοριστή του πίνακα, Πρότυπο:Math είναι η διαστατικότητα του διανυσματικού χώρου και το αποτέλεσμα έχει μονάδες nats.

Απόκλιση Kullback–Leibler

Η απόκλιση Kullback-Leibler από 𝒩1(μ1,Σ1) σε 𝒩0(μ0,Σ0), για μη ιδιάζοντες πίνακες Σ1 και Σ0, is:[21]

DKL(𝒩0𝒩1)=12{tr(Σ11Σ0)+(μ1μ0)TΣ11(μ1μ0)k+ln|Σ1||Σ0|},

όπου || δηλώνει τον προσδιοριστή του πίνακα, tr() είναι το ίχνος, ln() είναι ο φυσικός λογάριθμος και k είναι η διάσταση του διανυσματικού χώρου.

Ο λογάριθμος πρέπει να λαμβάνεται στη βάση e, δεδομένου ότι οι δύο όροι που ακολουθούν τον λογάριθμο είναι οι ίδιοι λογάριθμοι στη βάση e εκφράσεων που είτε είναι παράγοντες της συνάρτησης πυκνότητας είτε προκύπτουν με άλλο τρόπο φυσικά.

Διαιρώντας ολόκληρη την παραπάνω έκφραση με loge 2 προκύπτει η απόκλιση σε bit.

Όταν μ1=μ0,

DKL(𝒩0𝒩1)=12{tr(Σ11Σ0)k+ln|Σ1||Σ0|}.

Κανονικά κατανεμημένη και ανεξάρτητη

Εάν τα X και Y είναι κανονικά κατανεμημένα ανεξάρτητα, αυτό σημαίνει ότι είναι «από κοινού κανονικά κατανεμημένα», δηλαδή το ζεύγος (X,Y) πρέπει να έχει πολυμεταβλητή κανονική κατανομή. Ωστόσο, ένα ζεύγος από κοινού κανονικά κατανεμημένων μεταβλητών δεν χρειάζεται να είναι ανεξάρτητο (θα ήταν έτσι μόνο αν ήταν ασυσχέτιστο, ρ=0 ).

Δύο κανονικά κατανεμημένες τυχαίες μεταβλητές δεν χρειάζεται να είναι από κοινού διμεταβλητές κανονικές

Το γεγονός ότι δύο τυχαίες μεταβλητές X και Y έχουν και οι δύο κανονική κατανομή δεν σημαίνει ότι το ζεύγος (X,Y) έχει από κοινού κανονική κατανομή. Ένα απλό παράδειγμα είναι εκείνο στο οποίο το X έχει κανονική κατανομή με αναμενόμενη τιμή 0 και διακύμανση 1, και Y=X αν |X|>c και Y=X αν |X|<c, όπου c>0. Υπάρχουν παρόμοια αντιπαραδείγματα για περισσότερες από δύο τυχαίες μεταβλητές. Γενικά, αθροίζουν σε ένα μοντέλο μίξης.

Συσχετίσεις και ανεξαρτησία

Γενικά, οι τυχαίες μεταβλητές μπορεί να είναι ασυσχέτιστες αλλά στατιστικά εξαρτημένες. Αν όμως ένα τυχαίο διάνυσμα έχει πολυμεταβλητή κανονική κατανομή, τότε οποιαδήποτε δύο ή περισσότερες συνιστώσες του που είναι ασυσχέτιστες είναι ανεξάρτητες. Αυτό σημαίνει ότι οποιεσδήποτε δύο ή περισσότερες συνιστώσες του που είναι ανεξάρτητες κατά ζεύγη είναι ανεξάρτητες. Αλλά, όπως επισημάνθηκε μόλις παραπάνω, δεν ισχύει ότι δύο τυχαίες μεταβλητές που είναι (ξεχωριστά, οριακά) κανονικά κατανεμημένες και ασυσχέτιστες είναι ανεξάρτητες.

Κατανομές υπό όρους

Αν το Ν -διάστατο x κατανεμηθεί ως εξής

𝐱=[𝐱1𝐱2] with sizes [q×1(Nq)×1]

και κατά συνέπεια τα μ και Σ κατανέμονται ως εξής

μ=[μ1μ2] with sizes [q×1(Nq)×1]
Σ=[Σ11Σ12Σ21Σ22] with sizes [q×qq×(Nq)(Nq)×q(Nq)×(Nq)]


τότε η κατανομή των x2 = a υπό την προϋπόθεση x2 = a είναι πολυμεταβλητή κανονική [22] Πρότυπο:Nowrap όπου

μ¯=μ1+Σ12Σ221(𝐚μ2)

και πίνακα συνδιακύμανσης

Σ=Σ11Σ12Σ221Σ21.[23]

Εδώ Σ221 είναι το γενικευμένο αντίστροφο του Σ22. Ο πίνακας Σ είναι το συμπλήρωμα Σουρ (Schur) του Σ22 στο Σ. Δηλαδή, η παραπάνω εξίσωση είναι ισοδύναμη με την αντιστροφή του συνολικού πίνακα συνδιακύμανσης, την αφαίρεση των γραμμών και των στηλών που αντιστοιχούν στις μεταβλητές που εξαρτώνται και την αντιστροφή προς τα πίσω για να προκύψει ο υπό συνθήκη πίνακας συνδιακύμανσης.

Ας σημειωθεί ότι γνωρίζοντας ότι Πρότυπο:Nowrap μεταβάλλει τη διακύμανση, αν και η νέα διακύμανση δεν εξαρτάται από τη συγκεκριμένη τιμή του a', ίσως πιο εντυπωσιακό είναι ότι ο μέσος όρος μετατοπίζεται κατά Σ12Σ221(𝐚μ2); σε σύγκριση με την περίπτωση που δεν γνωρίζουμε την τιμή του a, οπότε x1 θα είχε κατανομή 𝒩q(μ1,Σ11).

Ένα ενδιαφέρον γεγονός που προέκυψε προκειμένου να αποδειχθεί αυτό το αποτέλεσμα, είναι ότι τα τυχαία διανύσματα 𝐱2 και 𝐲1=𝐱1Σ12Σ221𝐱2 είναι ανεξάρτητα.

Ο πίνακας Σ12Σ22−1 είναι γνωστός ως πίνακας των συντελεστών παλινδρόμησης.

Διμεταβλητή περίπτωση

Στη διμεταβλητή περίπτωση όπου το x χωρίζεται σε X1 και X2, η υπό συνθήκη κατανομή του X1 δεδομένου του X2 είναι [24]

X1X2=a  𝒩(μ1+σ1σ2ρ(aμ2),(1ρ2)σ12)

όπου ρ είναι ο συντελεστής συσχέτισης μεταξύ X1 and X2.

Διμεταβλητή υπό συνθήκη προσδοκία

Γενική περίπτωση
(X1X2)𝒩((μ1μ2),(σ12ρσ1σ2ρσ1σ2σ22))

Η υπό συνθήκη προσδοκία της X1 given X2 είναι:

E(X1X2=x2)=μ1+ρσ1σ2(x2μ2)

Απόδειξη: το αποτέλεσμα προκύπτει με τη λήψη της προσδοκίας της υπό συνθήκη κατανομής X1X2 παραπάνω.

Στην περίπτωση με κέντρο και μοναδιαίες αποκλίσεις
(X1X2)𝒩((00),(1ρρ1))

Η υπό συνθήκη προσδοκία της X1 given X2 είναι

E(X1X2=x2)=ρx2

και η υπό συνθήκη διακύμανση είναι

var(X1X2=x2)=1ρ2;

έτσι η υπό συνθήκη διακύμανση δεν εξαρτάται από x2.

Η υπό συνθήκη προσδοκία της X1 λαμβάνοντας υπόψιν ότι το Χ2 είναι μικρότερο/μεγαλύτερο από το z είναι:[25]Πρότυπο:Rp

E(X1X2<z)=ρφ(z)Φ(z),
E(X1X2>z)=ρφ(z)(1Φ(z)),

όπου ο τελικός λόγος εδώ ονομάζεται αντίστροφος λόγος Μιλς.

Απόδειξη: τα δύο τελευταία αποτελέσματα προκύπτουν με τη χρήση του αποτελέσματος E(X1X2=x2)=ρx2, έτσι ώστε

E(X1X2<z)=ρE(X2X2<z) και στη συνέχεια χρησιμοποιώντας τις ιδιότητες της προσδοκίας μιας αποκομμένης κανονικής κατανομής.

Περιθωριακές κατανομές

Για να λάβουμε την περιθωριακή κατανομή σε ένα υποσύνολο πολυμεταβλητών κανονικών τυχαίων μεταβλητών, αρκεί να αφαιρέσουμε τις άσχετες μεταβλητές (τις μεταβλητές που θέλουμε να εξαιρέσουμε) από το διάνυσμα του μέσου όρου και τον πίνακα συνδιακύμανσης. Η απόδειξη γι' αυτό προκύπτει από τους ορισμούς των πολυμεταβλητών κανονικών κατανομών και της γραμμικής άλγεβρας[26].

Παράδειγμα

Έστω Πρότυπο:Nowrap πολυμεταβλητές κανονικές τυχαίες μεταβλητές με μέσο διάνυσμα Πρότυπο:Nowrap και πίνακα συνδιακύμανσης Σ (τυποποιημένη παραμετροποίηση για πολυμεταβλητές κανονικές κατανομές). Τότε η κοινή κατανομή του X′ = [X1, X3] είναι πολυμεταβλητή κανονική με μέσο διάνυσμα μ′ = [μ1, μ3] και πίνακα συνδιακύμανσης

Σ=[Σ11Σ13Σ31Σ33].

Αφινικός μετασχηματισμός

Αν Πρότυπο:Nowrap είναι αφινικός μετασχηματισμός του 𝐗 𝒩(μ,Σ), όπου c είναι ένα M×1 διάνυσμα σταθερών και B είναι ένας σταθερός M×N πίνακας, τότε Y έχει πολυμεταβλητή κανονική κατανομή με αναμενόμενη τιμή Πρότυπο:Nowrap και διακύμανση BΣBT i.e., 𝐘𝒩(𝐜+𝐁μ,𝐁Σ𝐁T). Ειδικότερα, κάθε υποσύνολο των Xi έχει μια οριακή κατανομή που είναι επίσης πολυμεταβλητή κανονική. Για να γίνει αυτό αντιληπτό, ας θεωρήσουμε το ακόλουθο παράδειγμα: για να εξάγουμε το υποσύνολο (X1, X2, X4)T, χρησιμοποιώντας

𝐁=[100000010000000100]

που εξάγει απευθείας τα επιθυμητά στοιχεία.

Ένα άλλο συμπέρασμα είναι ότι η κατανομή του Πρότυπο:Nowrap, όπου b είναι ένα σταθερό διάνυσμα με τον ίδιο αριθμό στοιχείων με το X' και η τελεία υποδηλώνει το γινόμενο τελείας, είναι μονομεταβλητή γκαουσιανή με Z𝒩(𝐛μ,𝐛TΣ𝐛).

𝐁=[b1b2bn]=𝐛T.

Προσέξτε πώς η θετική οριστικότητα του Σ συνεπάγεται ότι η διακύμανση του γινομένου τελείας πρέπει να είναι θετική.

Ένας αφινικός μετασχηματισμός του Χ όπως το 2Χ δεν είναι το ίδιο με το άθροισμα δύο ανεξάρτητων πραγματώσεων του Χ.

Ταξινόμηση σε πολυμεταβλητές κανονικές κλάσεις

Αριστερά: Ταξινόμηση επτά πολυμεταβλητών κανονικών κλάσεων. Οι έγχρωμες ελλείψεις είναι ελλείψεις σφάλματος 1 sd. Με μαύρο χρώμα σημειώνονται τα όρια μεταξύ των περιοχών ταξινόμησης. pe είναι η πιθανότητα συνολικού σφάλματος ταξινόμησης. Δεξιά: ο πίνακας σφαλμάτων. pij είναι η πιθανότητα ταξινόμησης ενός δείγματος από το κανονικό i ως j. Υπολογίζονται με την αριθμητική μέθοδο της ανίχνευσης ακτίνων [14] (Matlab code).

Γκαουσιανή διακριτική ανάλυση

Ας υποθέσουμε ότι οι παρατηρήσεις (που είναι διανύσματα) υποτίθεται ότι προέρχονται από μία από έναν αριθμό πολυμεταβλητών κανονικών κατανομών, με γνωστούς μέσους όρους και συνδιακυμάνσεις. Οποιαδήποτε δεδομένη παρατήρηση μπορεί τότε να ανατεθεί στην κατανομή από την οποία έχει τη μεγαλύτερη πιθανότητα να προέρχεται. Αυτή η διαδικασία ταξινόμησης είναι γνωστή ως ανάλυση διαχωρισμού Γκάους. Η απόδοση της ταξινόμησης, δηλαδή οι πιθανότητες των διαφόρων αποτελεσμάτων ταξινόμησης και το συνολικό σφάλμα ταξινόμησης, μπορούν να υπολογιστούν με την αριθμητική μέθοδο της ανίχνευσης ακτίνων [14] (Matlab code).

Υπολογιστικές μέθοδοι

Συλλογή τιμών από την κατανομή

Μια ευρέως χρησιμοποιούμενη μέθοδος για την εξαγωγή (δειγματοληψία) ενός τυχαίου διανύσματος x' από την Ν-διάστατη πολυδιάστατη κανονική κατανομή με μέσο διάνυσμα μ' και πίνακα συνδιακύμανσης Σ λειτουργεί ως εξής:[27]

  1. Βρείτε κάθε πραγματικό πίνακα A τέτοιο ώστε Πρότυπο:Nowrap. Όταν το Σ είναι θετικά ορισμένο, χρησιμοποιείται συνήθως η ανάλυση Χολέσκι, και η εκτεταμένη μορφή αυτής της αποσύνθεσης μπορεί πάντα να χρησιμοποιηθεί (καθώς ο πίνακας συνδιακύμανσης μπορεί να είναι μόνο θετικά ημι-ορισμένος) και στις δύο περιπτώσεις λαμβάνεται ένας κατάλληλος πίνακας A. Μια εναλλακτική λύση είναι η χρήση του πίνακα A = 1/2 που προκύπτει από τη φασματική αποσύνθεση Σ = UΛU−1 of Σ. Η πρώτη προσέγγιση είναι πιο απλή υπολογιστικά, αλλά οι πίνακες Α αλλάζουν για διαφορετικές διατάξεις των στοιχείων του τυχαίου διανύσματος, ενώ η δεύτερη προσέγγιση δίνει πίνακες που σχετίζονται με απλές αναδιατάξεις. Θεωρητικά και οι δύο προσεγγίσεις δίνουν εξίσου καλούς τρόπους προσδιορισμού ενός κατάλληλου πίνακα A, αλλά υπάρχουν διαφορές στον υπολογιστικό χρόνο.
  2. Έστω Πρότυπο:Nowrap ένα διάνυσμα του οποίου οι συνιστώσες είναι N ανεξάρτητες τυπικές κανονικές μεταβλητές (οι οποίες μπορούν να παραχθούν, για παράδειγμα, με τη χρήση του μετασχηματισμού Μποξ-Μίλερ).
  3. Έστω x be Πρότυπο:Nowrap. Η επιθυμητή κατανομή λαμβάνεται χρησιμοποιώντας την ιδιότητα του αφινικού μετασχηματισμού.

Εξωτερικοί σύνδεσμοι

Δείτε επίσης

Βιβλιογραφία

Παραπομπές

Πρότυπο:Reflist

Πηγές

Πρότυπο:Portal bar Πρότυπο:Authority control

  1. 1,0 1,1 1,2 Πρότυπο:Cite book
  2. Πρότυπο:Cite book
  3. Πρότυπο:Cite journal
  4. Πρότυπο:Cite journal
  5. Simon J.D. Prince(June 2012). Computer Vision: Models, Learning, and Inference Πρότυπο:Webarchive. Cambridge University Press. 3.7:"Multivariate normal distribution".
  6. Πρότυπο:Cite journal
  7. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα HT
  8. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα wyattlms
  9. Πρότυπο:Cite web
  10. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα rao
  11. 11,0 11,1 Πρότυπο:Cite journal
  12. Πρότυπο:Cite book
  13. 13,0 13,1 Bensimhoun Michael, N-Dimensional Cumulative Function, And Other Useful Facts About Gaussians and Normal Densities (2006)
  14. 14,0 14,1 14,2 14,3 14,4 14,5 14,6 14,7 14,8 Πρότυπο:Cite arXiv
  15. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα Siotani
  16. 16,0 16,1 Πρότυπο:Cite conference
  17. Πρότυπο:Cite conference
  18. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα Hernandez-Stumpfhauser
  19. Tong, T. (2010) Multiple Linear Regression : MLE and Its Distributional Results Πρότυπο:Webarchive, Lecture Notes
  20. Πρότυπο:Cite journal
  21. Πρότυπο:Cite journal
  22. Πρότυπο:Cite journal
  23. Πρότυπο:Cite book
  24. Πρότυπο:Cite book
  25. Πρότυπο:Cite book
  26. An algebraic computation of the marginal distribution is shown here http://fourier.eng.hmc.edu/e161/lectures/gaussianprocess/node7.html Πρότυπο:Webarchive. A much shorter proof is outlined here https://math.stackexchange.com/a/3832137
  27. Σφάλμα παραπομπής: Μη έγκυρη ετικέτα <ref>• δεν δίνεται κείμενο για παραπομπές με όνομα Gentle