Απόκλιση Kullback–Leibler

Από testwiki
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Στην θεωρία πληροφορίας, η απόκλιση Kullback-Leibler (KL)σχετική εντροπία) μεταξύ δύο κατανομών πιθανότητας p και q ορίζεται ως[1]Πρότυπο:Rp

DKL(pq):=EXp[logq(x)+logp(X)].

Για διακριτές τυχαίες μεταβλητές με πεδίο ορισμού 𝒳, αυτή η ποσότητα είναι ίση με

DKL(pq)=x𝒳p(x)log(p(x)q(x)),

και για συνεχείς τυχαίες μεταβλητές είναι ίση με

DKL(pq)=x𝒳p(x)log(p(x)q(x))dx.

Η ποσότητα αυτή μπορεί να ερμηνευτεί ως η αναμενόμενη τιμή της έξτρα πληροφορίας που χρειάζεται για να κωδικοποιήσουμε την τυχαία μεταβλητή X με κατανομή p υποθέτοντας ότι στην πραγματικότητα έχει κατανομή q.

Η συνάρτηση είναι απόκλιση και όχι μετρική απόσταση καθώς δεν ικανοποιεί την τριγωνική ανισότητα ούτε είναι συμμετρική.[2]

Παράδειγμα

Οι κατανομές πιθανότητας p και q.

Για τις κατανομές p=(13,13,13) και q=(0.2,0.5,0.3), η απόκλιση KL δίνεται από

DKL(pq)=p1log2(p1/q1)+p2log2(p2/q2)+p3log2(p3/q3)=13log2(1/30.2)+13log2(1/30.5)+13log2(1/30.3)0.1013,

και

DKL(pq)=q1log2(q1/p1)+q2log2(q2/p2)+q3log2(q3/p3)=0.2log2(0.21/3)+0.5log2(0.51/3)+0.3log2(0.31/3)0.0994.

Από αυτό το παράδειγμα φαίνεται ότι η απόκλιση δεν είναι συμμετρική.

Ιδιότητες

  • (Μη-μηδενικότητα) Για οποιεσδήποτε δύο κατανομές p και q, ισχύει ότι
DKL(pq)0.

Πρότυπο:Μαθηματική απόδειξη

DKL(λp1+(1λ)p2λq1+(1λ)q2)λDKL(p1q1)+(1λ)DKL(p2q2).
  • (Ανεξάρτητες μεταβλητές) Η απόκλιση Kullback-Leibler είναι αθροιστική για τις ανεξάρτητες τυχαίες μεταβλητές X και Y, δηλαδή με p(X,Y)(x,y)=p1(x)p2(y) και q(X,Y)(x,y)=q1(x)q2(y),[4]
DKL(pq)=DKL(p1q1)+DKL(p2q2).

Πρότυπο:Μαθηματική απόδειξη

Δείτε επίσης

Παραπομπές

Πρότυπο:Μαθηματικά-επέκταση