Κατανομή Παρέτο

Από testwiki
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση
Συναρτήσεις πυκνότητας πιθανότητας Παρέτο τύπου Ι για διάφορες α Συναρτήσεις πυκνότητας πιθανότητας Παρέτο τύπου Ι για διάφορες α με xm=1. Καθώς α, η κατανομή πλησιάζει την δ(xxm), όπου δ είναι η συνάρτηση δέλτα Ντιράκ.

Η κατανομή Παρέτο, που πήρε το όνομά της από τον Ιταλό πολιτικό μηχανικό, οικονομολόγο και κοινωνιολόγο Βιλφρέντο Παρέτο[1], είναι μια κατανομή πιθανοτήτων με νόμο δύναμης που χρησιμοποιείται στην περιγραφή κοινωνικών, ποιοτικού ελέγχου, επιστημονικών, γεωφυσικών, αναλογιστικών και πολλών άλλων τύπων παρατηρήσιμων φαινομένων.Η αρχή εφαρμόστηκε αρχικά για την περιγραφή της κατανομής του πλούτου σε μια κοινωνία, ταιριάζοντας στην τάση ότι ένα μεγάλο μέρος του πλούτου κατέχεται από ένα μικρό μέρος του πληθυσμού.[2]

Η αρχή του Παρέτο ή ο «κανόνας 80:20» που δηλώνει ότι το 80% των αποτελεσμάτων οφείλεται στο 20% των αιτιών πήρε το όνομά της προς τιμήν του Παρέτο, αλλά οι έννοιες είναι διαφορετικές και μόνο οι κατανομές Παρέτο με τιμή σχήματος (Πρότυπο:Math) Πρότυπο:Nobr την αντικατοπτρίζουν με ακρίβεια. Η εμπειρική παρατήρηση έχει δείξει ότι αυτή η κατανομή 80:20 ταιριάζει σε ένα ευρύ φάσμα περιπτώσεων, συμπεριλαμβανομένων των φυσικών φαινομένων[3] και των ανθρώπινων δραστηριοτήτων.[4][5]

Ορισμοί

Συναρτήσεις αθροιστικής κατανομής τύπου Παρέτο για διάφορα α με xm=1.

Εάν η Χ είναι μια τυχαία μεταβλητή με κατανομή Παρέτο (τύπου Ι),[6] τότε η πιθανότητα η Χ να είναι μεγαλύτερη από κάποιον αριθμό x, δηλαδή η συνάρτηση επιβίωσης (που ονομάζεται επίσης συνάρτηση ουράς), δίνεται από τη σχέση

F(x)=Pr(X>x)={(xmx)αxxm,1x<xm,

όπου xm είναι η (αναγκαστικά θετική) ελάχιστη δυνατή τιμή του Χ και α είναι μια θετική παράμετρος. Η κατανομή Παρέτο τύπου Ι χαρακτηρίζεται από μια παράμετρο κλίμακας xm και μια παράμετρο σχήματος α, η οποία είναι γνωστή ως δείκτης ουράς. Εάν αυτή η κατανομή χρησιμοποιείται για τη μοντελοποίηση της κατανομής του πλούτου, τότε η παράμετρος α ονομάζεται δείκτης Παρέτο.

Αθροιστική συνάρτηση κατανομής

Από τον ορισμό, η αθροιστική συνάρτηση κατανομής μιας τυχαίας μεταβλητής Παρέτο με παραμέτρους α και xm είναι

FX(x)={1(xmx)αxxm,0x<xm.

Συνάρτηση πυκνότητας πιθανότητας

Προκύπτει (με διαφοροποίηση) ότι η συνάρτηση πυκνότητας πιθανότητας είναι

fX(x)={αxmαxα+1xxm,0x<xm.

Όταν απεικονίζεται σε γραμμικούς άξονες, η κατανομή παίρνει τη γνωστή καμπύλη σχήματος J, η οποία προσεγγίζει ασυμπτωτικά κάθε έναν από τους ορθογώνιους άξονες. Όλα τα τµήµατα της καµπύλης είναι αυτοοµοιόµορφα (µε την επιφύλαξη κατάλληλων συντελεστών κλιµάκωσης). Όταν απεικονίζεται σε λογαριθμογράφημα, η κατανομή παριστάνεται με μια ευθεία γραμμή.

Ιδιότητες

Ροπές και χαρακτηριστική συνάρτηση

  • Η αναμενόμενη τιμή μιας τυχαίας μεταβλητής που ακολουθεί την κατανομή Παρέτο είναι
E(X)={α1,αxmα1α>1.
  • Η διακύμανση μιας τυχαίας μεταβλητής που ακολουθεί την κατανομή Παρέτο είναι
Var(X)={α(1,2],(xmα1)2αα2α>2.
(αν α ≤ 2, η διακύμανση δεν υπάρχει.)
  • Οι μη κεντρικές ροπές είναι
μn={αn,αxmnαnα>n.
  • Η συνάρτηση δημιουργίας ροπής ορίζεται μόνο για μη θετικές τιμές t ≤ 0 ως εξής
M(t;α,xm)=E[etX]=α(xmt)αΓ(α,xmt)
M(0,α,xm)=1.

Έτσι, εφόσον η προσδοκία δεν συγκλίνει σε ένα ανοικτό διάστημα που περιέχει t=0 λέμε ότι η συνάρτηση που δημιουργεί τη ροπή δεν υπάρχει.

  • Η χαρακτηριστική συνάρτηση δίνεται από τη σχέση
φ(t;α,xm)=α(ixmt)αΓ(α,ixmt),
όπου Γ(ax) είναι η ατελής συνάρτηση γάμμα.

Οι παράμετροι μπορούν να επιλυθούν με τη μέθοδο των ροπών.[7]

Κατανομή υπό όρους

Η υπό συνθήκη κατανομή πιθανότητας μιας τυχαίας μεταβλητής με κατανομή Παρέτο, δεδομένης της περίπτωσης ότι είναι μεγαλύτερη ή ίση από έναν συγκεκριμένο αριθμό&nbsp, x1 που υπερβαίνει το xm, είναι μια κατανομή Παρέτο με τον ίδιο δείκτη Παρέτο α αλλά με ελάχιστο x1 αντί του xm :

Pr(Xx|Xx1)={(x1x)αxx1,1x<x1.

Αυτό σημαίνει ότι η υπό συνθήκη αναμενόμενη αξία (εάν είναι πεπερασμένη, δηλαδή α>1) είναι ανάλογη του x1:

E(X|Xx1)x1.

Στην περίπτωση τυχαίων μεταβλητών που περιγράφουν τη διάρκεια ζωής ενός αντικειμένου, αυτό σημαίνει ότι το προσδόκιμο ζωής είναι ανάλογο της ηλικίας και ονομάζεται φαινόμενο Λίντι ή νόμος του Λίντι.[8]

Γεωμετρικός μέσος όρος

Ο γεωμετρικός μέσος (G) είναι[9]

G=xmexp(1α).

Γεωμετρικός μέσος όρος

Ο γεωμετρικός μέσος (G) είναι [9]

G=xmexp(1α).

Αρμονικός μέσος

Ο αρμονικός μέσος (H) είναι [9]

H=xm(1+1α).

Γραφική αναπαράσταση

Η χαρακτηριστική καμπυλωτή κατανομή «μακριά ουρά», όταν απεικονίζεται σε γραμμική κλίμακα, καλύπτει την υποκείμενη απλότητα της συνάρτησης όταν απεικονίζεται σε λογαριθμογράφημα, το οποίο τότε παίρνει τη μορφή ευθείας γραμμής με αρνητική κλίση: Από τον τύπο της συνάρτησης πυκνότητας πιθανότητας προκύπτει ότι για xxm,

logfX(x)=log(αxmαxα+1)=log(αxmα)(α+1)logx.

Εφόσον το α είναι θετικό, η κλίση -(α + 1) είναι αρνητική.

Σχετικές διανομές

Γενικευμένες κατανομές Παρέτο

Υπάρχει μια ιεραρχία [6][10] των κατανομών Παρέτο που είναι γνωστές ως κατανομές Παρέτο τύπου Ι, ΙΙ, ΙΙΙ, IV και Φέλερ-Παρέτο.[6][10][11] Ο τύπος Παρέτο IV περιέχει τους τύπους Παρέτο Ι-ΙΙΙΙ ως ειδικές περιπτώσεις. Η κατανομή Φέλερ - Παρέτο[10][12] γενικεύει την κατανομή τύπου Παρέτο IV.

Τύποι I-IV

Η ιεραρχία της κατανομής Pareto συνοψίζεται στον επόμενο πίνακα που συγκρίνει τις συναρτήσεις επιβίωσης (συμπληρωματική CDF).

Όταν μ = 0, η κατανομή Pareto τύπου II είναι επίσης γνωστή ως κατανομή Λόμαξ.[13]

Σε αυτό το τμήμα, το σύμβολο xm, που χρησιμοποιήθηκε προηγουμένως για να υποδηλώσει την ελάχιστη τιμή του x, αντικαθίσταται από το εξής με σ.

Κατανομές Παρέτο
F(x)=1F(x) Υποστήριξη Παράμετροι
Τύπος I [xσ]α xσ σ>0,α
Τύπος II [1+xμσ]α xμ μ,σ>0,α
Λόμαξ [1+xσ]α x0 σ>0,α
Τύπος III [1+(xμσ)1/γ]1 xμ μ,σ,γ>0
Τύπος IV [1+(xμσ)1/γ]α xμ μ,σ,γ>0,α

Η παράμετρος σχήματος α είναι ο δείκτης ουράς, μ είναι η θέση, σ είναι η κλίμακα, γ είναι μια παράμετρος ανισότητας. Ορισμένες ειδικές περιπτώσεις του τύπου Pareto (IV) είναι

P(IV)(σ,σ,1,α)=P(I)(σ,α),
P(IV)(μ,σ,1,α)=P(II)(μ,σ,α),
P(IV)(μ,σ,γ,1)=P(III)(μ,σ,γ).

Το πεπερασμένο του μέσου και η ύπαρξη και το πεπερασμένο της διακύμανσης εξαρτώνται από τον δείκτη ουράς α (δείκτης ανισότητας γ). Ειδικότερα, τα κλασματικά δ'-μεγέθη είναι πεπερασμένα για κάποιο δ > 0, όπως φαίνεται στον παρακάτω πίνακα, όπου το δ δεν είναι απαραίτητα ακέραιος αριθμός.

Ροπές των κατανομών Παρέτο I-IV (περίπτωση μ = 0)
E[X] Κατάσταση E[Xδ] Κατάσταση
Τύπος I σαα1 α>1 σδααδ δ<α
Τύπος II σα1+μ α>1 σδΓ(αδ)Γ(1+δ)Γ(α) 0<δ<α
Τύπος III σΓ(1γ)Γ(1+γ) 1<γ<1 σδΓ(1γδ)Γ(1+γδ) γ1<δ<γ1
Τύπος IV σΓ(αγ)Γ(1+γ)Γ(α) 1<γ<α σδΓ(αγδ)Γ(1+γδ)Γ(α) γ1<δ<α/γ

Κατανομή Φέλερ-Παρέτο

Ο Φέλερ[10][12] ορίζει μια μεταβλητή Παρέτο με το μετασχηματισμό U = Y−1 − 1 μιας τυχαίας μεταβλητής βήτα ,Y, της οποίας η συνάρτηση πυκνότητας πιθανότητας είναι

f(y)=yγ11(1y)γ21B(γ1,γ2),0<y<1;γ1,γ2>0,

όπου B( ) είναι η συνάρτηση βήτα. Εάν

W=μ+σ(Y11)γ,σ>0,γ>0,

τότε το W έχει κατανομή Φέλερ-Παρέτο FP(μ, σ, γ, γ1, γ2).[6]

Αν U1Γ(δ1,1) και U2Γ(δ2,1) είναι ανεξάρτητες μεταβλητές Γάμμα, μια άλλη κατασκευή μιας μεταβλητής Φέλερ-Παρέτο (FP) είναι η εξής [14]

W=μ+σ(U1U2)γ

και γράφουμε W ~ FP(μ, σ, γ, δ1, δ2). Ειδικές περιπτώσεις της κατανομής Φέλερ - Παρέτο είναι οι εξής

FP(σ,σ,1,1,α)=P(I)(σ,α)
FP(μ,σ,1,1,α)=P(II)(μ,σ,α)
FP(μ,σ,γ,1,1)=P(III)(μ,σ,γ)
FP(μ,σ,γ,1,α)=P(IV)(μ,σ,γ,α).

Αντίστροφη κατανομή Παρέτο / Κατανομή ισχύος

Όταν μια τυχαία μεταβλητή Y ακολουθεί μια κατανομή Παρέτο, τότε η αντίστροφη X=1/Y ακολουθεί μια αντίστροφη κατανομή Παρέτο. Η αντίστροφη κατανομή Παρέτο είναι ισοδύναμη με την κατανομή ισχύος[15]

YPa(α,xm)=αxmαyα+1(yxm)XiPa(α,xm)=Power(xm1,α)=αxα1(xm1)α(0<xxm1)

Σχέση με την εκθετική κατανομή

Η κατανομή Παρέτο σχετίζεται με την εκθετική κατανομή ως εξής. Εάν η X είναι κατανεμημένη κατά Παρέτο με ελάχιστο xm και δείκτη α, τότε

Y=log(Xxm)

κατανέμεται εκθετικά με παράμετρο ρυθμού α. Ισοδύναμα, εάν η Y κατανέμεται εκθετικά με ρυθμό α, τότε

xmeY

έχει κατανομή Παρέτο με ελάχιστο xm και δείκτη α.

Αυτό μπορεί να αποδειχθεί χρησιμοποιώντας τις συνήθεις τεχνικές αλλαγής των μεταβλητών:

Pr(Y<y)=Pr(log(Xxm)<y)=Pr(X<xmey)=1(xmxmey)α=1eαy.

Η τελευταία έκφραση είναι η αθροιστική συνάρτηση κατανομής μιας εκθετικής κατανομής με ρυθμό α.

Η κατανομή Παρέτο μπορεί να κατασκευαστεί από ιεραρχικές εκθετικές κατανομές.[16] Έστω ϕ|aExp(a) και η|ϕExp(ϕ). Τότε έχουμε p(η|a)=a(a+η)2 και, ως εκ τούτου,a+ηPareto(a,1).

Γενικότερα, εάν λGamma(α,β) (παραμετροποίηση σχήματος-ρυθμού) και η|λExp(λ), τότε β+ηPareto(β,α).

Ισοδύναμα, εάν YGamma(α,1) και XExp(1), τότε xm(1+XY)Pareto(xm,α).

Σχέση με τη λογαριθμοκανονική κατανομή

Η κατανομή Παρέτο και η λογαριθμοκανονική κατανομή είναι εναλλακτικές κατανομές για την περιγραφή των ίδιων τύπων ποσοτήτων. Μία από τις συνδέσεις μεταξύ των δύο είναι ότι και οι δύο είναι οι κατανομές της εκθετικής των τυχαίων μεταβλητών που κατανέμονται σύμφωνα με άλλες κοινές κατανομές, αντίστοιχα την εκθετική κατανομή και την κανονική κατανομή. (Βλέπε την προηγούμενη ενότητα).

Σχέση με τη γενικευμένη κατανομή Παρέτο

Η κατανομή Παρέτο αποτελεί ειδική περίπτωση της γενικευμένης κατανομής Παρέτο, η οποία είναι μια οικογένεια κατανομών παρόμοιας μορφής, αλλά που περιέχουν μια επιπλέον παράμετρο με τέτοιο τρόπο ώστε η υποστήριξη της κατανομής να είναι είτε περιορισμένη από κάτω (σε ένα μεταβλητό σημείο), είτε περιορισμένη τόσο από πάνω όσο και από κάτω (όπου και τα δύο είναι μεταβλητά), με ειδική περίπτωση την κατανομή Λόμαξ. Η οικογένεια αυτή περιλαμβάνει επίσης τόσο την μη μετατοπισμένη όσο και τη μετατοπισμένη εκθετική κατανομή.

Η κατανομή Παρέτο με κλίμακα xm και σχήμα α είναι ισοδύναμη με τη γενικευμένη κατανομή Παρέτο με θέση μ=xm, κλίμακα σ=xm/α και σχήμα ξ=1/α και, αντίστροφα, μπορεί κανείς να πάρει την κατανομή Παρέτο από την GPD λαμβάνοντας xm=σ/ξ και α=1/ξ αν ξ>0.

Φραγμένη κατανομή Παρέτο

Η φραγμένη (ή περικομμένη) κατανομή Παρέτο έχει τρεις παραμέτρους: α, L και H. Όπως και στην τυπική κατανομή Παρέτο, το α καθορίζει το σχήμα. Το L υποδηλώνει την ελάχιστη τιμή και το H υποδηλώνει τη μέγιστη τιμή.

Η συνάρτηση πυκνότητας πιθανότητας είναι

αLαxα11(LH)α,

όπου L ≤ x ≤ H, και α > 0.

Παραγωγή φραγμένων τυχαίων μεταβλητών Παρέτο

Εάν το U είναι ομοιόμορφα κατανεμημένο στο (0, 1), τότε η εφαρμογή της μεθόδου αντίστροφου μετασχηματισμού.[17]

U=1Lαxα1(LH)α
x=(UHαULαHαHαLα)1α

είναι μια φραγμένη κατανομή Παρέτο.

Συμμετρική κατανομή Παρέτο

Ο σκοπός των συμμετρικών και μηδενικών συμμετρικών κατανομών Παρέτο είναι να αποτυπώσουν κάποια ειδική στατιστική κατανομή με αιχμηρή κορυφή πιθανότητας και συμμετρικές μακριές ουρές πιθανότητας. Οι δύο αυτές κατανομές προέρχονται από την κατανομή Παρέτο. Οι μακριές ουρές πιθανότητας συνήθως σημαίνουν ότι η πιθανότητα φθίνει αργά και μπορούν να χρησιμοποιηθούν για την προσαρμογή διαφόρων συνόλων δεδομένων. Αλλά αν η κατανομή έχει συμμετρική δομή με δύο αργά φθίνουσες ουρές, η Παρέτο δεν θα μπορούσε να το κάνει. Τότε εφαρμόζεται αντ' αυτού η συμμετρική κατανομή Παρέτο ή η μηδενική συμμετρική κατανομή Παρέτο.[18]

Η αθροιστική συνάρτηση κατανομής (CDF) της συμμετρικής κατανομής Παρέτο ορίζεται ως εξής:[18]

F(X)=P(x<X)={12(b2bX)aX<b112(bX)aXb

Η αντίστοιχη συνάρτηση πυκνότητας πιθανότητας (PDF) είναι:[18]

p(x)=aba2(b+|xb|)a+1,XR

Η κατανομή αυτή έχει δύο παραμέτρους: a και b. Είναι συμμετρική ως προς το b. Τότε η μαθηματική προσδοκία είναι b. Όταν, έχει διακύμανση ως εξής:

E((xb)2)=(xb)2p(x)dx=2b2(a2)(a1)

Η CDF της μηδενικής συμμετρικής κατανομής Παρέτο (ZSP) ορίζεται ως εξής:

F(X)=P(x<X)={12(bbX)aX<0112(bb+X)aX0

Η αντίστοιχη PDF είναι:

p(x)=aba2(b+|x|)a+1,XR

Η κατανομή αυτή είναι συμμετρική ως προς το μηδέν. Η παράμετρος a σχετίζεται με τον ρυθμό αποσύνθεσης της πιθανότητας και η (a/2b) αντιπροσωπεύει το μέγιστο μέγεθος της πιθανότητας.[18]

Πολυμεταβλητή κατανομή Παρέτο

Η μονομεταβλητή κατανομή Παρέτο έχει επεκταθεί σε μια πολυμεταβλητή κατανομή Παρέτο.[19]

Στατιστική συμπερασματολογία

Εκτίμηση των παραμέτρων

Η συνάρτηση πιθανότητας για τις παραμέτρους α και xm της κατανομής Παρέτο, δεδομένου ενός ανεξάρτητου δείγματος x = (x1x2, ..., xn), είναι

L(α,xm)=i=1nαxmαxiα+1=αnxmnαi=1n1xiα+1.

Επομένως, η λογαριθμική συνάρτηση πιθανότητας είναι

(α,xm)=nlnα+nαlnxm(α+1)i=1nlnxi.

Γίνεται αντιληπτό ότι η (α,xm) είναι μονότονα αυξανόμενη με το xm, δηλαδή όσο μεγαλύτερη είναι η τιμή του xm, τόσο μεγαλύτερη είναι η τιμή της συνάρτησης πιθανότητας. Συνεπώς, εφόσον xxm, συμπεραίνουμε ότι

x^m=minixi.

Για να βρούμε τον εκτιμητή για το α, υπολογίζουμε την αντίστοιχη μερική παράγωγο και προσδιορίζουμε πού είναι μηδέν:

α=nα+nlnxmi=1nlnxi=0.

Έτσι, ο εκτιμητής μέγιστης πιθανοφάνειας για το α είναι:

α^=niln(xi/x^m).

Το προσδοκώμενο στατιστικό σφάλμα είναι:[20]

σ=α^n.

Ο Μαλίκ (1970)[21] δίνει την ακριβή κοινή κατανομή των (x^m,α^). Ειδικότερα, x^m και α^ είναι ανεξάρτητα και x^m είναι Παρέτο με παράμετρο κλίμακας xm και παράμετρο σχήματος , ενώ α^ έχει κατανομή αντίστροφης γάμμα με παραμέτρους σχήματος και κλίμακας n − 1 και , αντίστοιχα.

Εμφάνιση και εφαρμογές

Γενικά

Ο Βιλφρέντο Παρέτο χρησιμοποίησε αρχικά αυτή την κατανομή για να περιγράψει την κατανομή του πλούτου μεταξύ των ατόμων, καθώς φαινόταν να δείχνει αρκετά καλά τον τρόπο με τον οποίο ένα μεγαλύτερο μέρος του πλούτου κάθε κοινωνίας ανήκει σε ένα μικρότερο ποσοστό των ατόμων της κοινωνίας αυτής. Το χρησιμοποίησε επίσης για να περιγράψει την κατανομή του εισοδήματος[4]. Η ιδέα αυτή εκφράζεται μερικές φορές πιο απλά ως η αρχή Παρέτο ή ο «κανόνας 80-20», ο οποίος δηλώνει ότι το 20% του πληθυσμού ελέγχει το 80% του πλούτου[24]. Όπως επισημαίνει ο Μάικλ Χάντσον («Η κατάρρευση της αρχαιότητας» [2023] σ. 85 & σημ. 7) «ένα μαθηματικό επακόλουθο [είναι] ότι το 10% θα είχε το 65% του πλούτου και το 5% θα είχε το μισό εθνικό πλούτο». Ωστόσο, ο κανόνας 80-20 αντιστοιχεί σε μια συγκεκριμένη τιμή του α, και στην πραγματικότητα, τα στοιχεία του Παρέτο για τους βρετανικούς φόρους εισοδήματος στο μάθημα πολιτικής οικονομίας δείχνουν ότι περίπου το 30% του πληθυσμού είχε περίπου το 70% του εισοδήματος. το γράφημα της συνάρτησης πυκνότητας πιθανότητας (PDF) στην αρχή αυτού του άρθρου δείχνει ότι η "πιθανότητα" ή το κλάσμα του πληθυσμού που κατέχει ένα μικρό ποσό πλούτου ανά άτομο είναι μάλλον υψηλό, και στη συνέχεια μειώνεται σταθερά καθώς αυξάνεται ο πλούτος. (Ωστόσο, η κατανομή Παρέτο δεν είναι ρεαλιστική για τον πλούτο για το κατώτερο άκρο. Στην πραγματικότητα, η καθαρή περιουσία μπορεί να είναι ακόμη και αρνητική). Αυτή η κατανομή δεν περιορίζεται στην περιγραφή του πλούτου ή του εισοδήματος, αλλά σε πολλές καταστάσεις στις οποίες εντοπίζεται ισορροπία στην κατανομή του "μικρού" προς το "μεγάλο". Τα ακόλουθα παραδείγματα θεωρούνται μερικές φορές ως προσεγγιστικά κατανεμημένα κατά Παρέτο:[22][23]

  • Και οι τέσσερις μεταβλητές του δημοσιονομικού περιορισμού του νοικοκυριού: κατανάλωση, εισόδημα εργασίας, εισόδημα κεφαλαίου και πλούτος.[24]
  • Τα μεγέθη των ανθρώπινων οικισμών (λίγες πόλεις, πολλά χωριουδάκια/χωριά).[25][26]
  • Η κατανομή του μεγέθους των αρχείων της κίνησης στο Διαδίκτυο που χρησιμοποιεί το πρωτόκολλο TCP (πολλά μικρότερα αρχεία, λίγα μεγαλύτερα).[25]
  • Ποσοστά σφαλμάτων μονάδων σκληρού δίσκου[27]
  • Συστάδες συμπυκνωμάτων Μπόζε-Αϊνστάιν κοντά στο απόλυτο μηδέν[28]
Προσαρμογή της αθροιστικής κατανομής Παρέτο (Lomax) στις μέγιστες βροχοπτώσεις μιας ημέρας με χρήση του CumFreq, βλέπε επίσης προσαρμογή κατανομής
  • Οι αξίες των αποθεμάτων πετρελαίου σε κοιτάσματα πετρελαίου (λίγα μεγάλα κοιτάσματα, πολλά μικρά κοιτάσματα).[25]
  • Η κατανομή του μήκους των εργασιών που ανατίθενται σε υπερυπολογιστές (λίγες μεγάλες, πολλές μικρές).[29]
  • Οι τυποποιημένες αποδόσεις των τιμών των μεμονωμένων μετοχών [25]
  • Τα μεγέθη των σωματιδίων της άμμου [25]
  • Το μέγεθος των μετεωριτών
  • Σοβαρότητα των μεγάλων ζημιών από ατυχήματα για ορισμένους επιχειρηματικούς κλάδους, όπως η γενική αστική ευθύνη, το επαγγελματικό αυτοκίνητο και η αποζημίωση των εργαζομένων.[30][31]
  • Ο χρόνος που ένας χρήστης στο Steam θα περάσει παίζοντας διάφορα παιχνίδια. (Μερικά παιχνίδια παίζονται πολύ, αλλά τα περισσότερα δεν παίζονται σχεδόν ποτέ).[32]
  • Στην υδρολογία η κατανομή Παρέτο εφαρμόζεται σε ακραία γεγονότα, όπως οι ετήσιες μέγιστες βροχοπτώσεις μιας ημέρας και οι εκφορτίσεις ποταμών.[33] Η μπλε εικόνα απεικονίζει ένα παράδειγμα προσαρμογής της κατανομής Παρέτο στην κατάταξη των ετήσιων μέγιστων βροχοπτώσεων μίας ημέρας, όπου φαίνεται επίσης η ζώνη εμπιστοσύνης 90% με βάση τη διωνυμική κατανομή. Τα δεδομένα βροχόπτωσης αναπαρίστανται με τη χάραξη θέσεων ως μέρος της ανάλυσης αθροιστικής συχνότητας.
  • Στην αξιοπιστία της διανομής ηλεκτρικής ενέργειας (το 80% των διακοπτόμενων λεπτών του Πελάτη συμβαίνει περίπου στο 20% των ημερών ενός έτους).

Σχέση με το νόμο του Ζιπφ

Η κατανομή Παρέτο είναι μια συνεχής κατανομή πιθανοτήτων. Ο νόμος του Ζιπφ, που μερικές φορές ονομάζεται επίσης κατανομή Ζήτα, είναι μια διακριτή κατανομή, που διαχωρίζει τις τιμές σε μια απλή κατάταξη. Και οι δύο είναι ένας απλός νόμος δύναμης με αρνητικό εκθέτη, που κλιμακώνεται έτσι ώστε οι αθροιστικές κατανομές τους να ισούνται με 1. Η κατανομή Ζιπφ μπορεί να προκύψει από την κατανομή Παρέτο αν οι τιμές x (εισοδήματα) κατανεμηθούν σε N τάξεις, έτσι ώστε ο αριθμός των ατόμων σε κάθε θέση να ακολουθεί ένα μοτίβο 1/τάξη. Η κατανομή κανονικοποιείται ορίζοντας xm έτσι ώστε αxmα=1H(N,α1) όπου H(N,α1) είναι ο γενικός αρμονικός αριθμός. Αυτό καθιστά τη συνάρτηση πυκνότητας πιθανότητας του Zipf παραγωγίσιμη από τη συνάρτηση του Παρέτο.

f(x)=αxmαxα+1=1xsH(N,s)

όπου s=α1 και x είναι ένας ακέραιος αριθμός που αντιπροσωπεύει την τάξη από το 1 έως το Ν, όπου Ν είναι η υψηλότερη εισοδηματική τάξη. Έτσι, ένα τυχαία επιλεγμένο άτομο (ή λέξη, σύνδεσμος ιστοσελίδας ή πόλη) από έναν πληθυσμό (ή γλώσσα, διαδίκτυο ή χώρα) έχει f(x) πιθανότητα κατάταξης x.

Σχέση με την «αρχή Παρέτο»

Ο «νόμος 80-20», σύμφωνα με τον οποίο το 20% του συνόλου των ανθρώπων λαμβάνει το 80% του συνολικού εισοδήματος και το 20% του πιο εύπορου 20% λαμβάνει το 80% αυτού του 80% κ.ο.κ., ισχύει ακριβώς όταν ο δείκτης Παρέτο είναι α=log45=log105log1041.161. Το αποτέλεσμα αυτό μπορεί να προκύψει από τον τύπο της καμπύλης Λόρεντζ που δίνεται παρακάτω. Επιπλέον, έχει αποδειχθεί[34] ότι τα ακόλουθα είναι μαθηματικά ισοδύναμα:

  • Το εισόδημα κατανέμεται σύμφωνα με την κατανομή Παρέτο με δείκτη α > 1.
  • Υπάρχει κάποιος αριθμός 0 ≤ p ≤ 1/2 τέτοιος ώστε το 100p % όλων των ανθρώπων να λαμβάνει το 100(1 − p)% του συνολικού εισοδήματος, και ομοίως για κάθε πραγματικό (όχι απαραίτητα ακέραιο) n > 0, 100pn % όλων των ανθρώπων λαμβάνει το 100(1 − p)n ποσοστό του συνολικού εισοδήματος. Το α α και το p συνδέονται ως εξής
11α=ln(1p)ln(p)=ln((1p)n)ln(pn)

Αυτό δεν ισχύει μόνο για το εισόδημα, αλλά και για τον πλούτο, ή για οτιδήποτε άλλο μπορεί να μοντελοποιηθεί με αυτή την κατανομή.

Αυτό αποκλείει τις κατανομές Παρέτο στις οποίες 0 < α ≤ 1, οι οποίες, όπως σημειώθηκε παραπάνω, έχουν άπειρη αναμενόμενη αξία και επομένως δεν μπορούν να μοντελοποιήσουν λογικά την κατανομή του εισοδήματος.

Σχέση με το νόμο του Πράις

Ο νόμος της τετραγωνικής ρίζας του Πράις προσφέρεται μερικές φορές ως ιδιότητα της κατανομής Παρέτο ή ως παρόμοια με αυτήν. Ωστόσο, ο νόμος ισχύει μόνο στην περίπτωση που α=1. Σημειώστε ότι σε αυτή την περίπτωση, το συνολικό και το αναμενόμενο ποσό πλούτου δεν ορίζονται και ο κανόνας ισχύει ασυμπτωτικά μόνο για τυχαία δείγματα. Η εκτεταμένη αρχή Παρέτο που αναφέρθηκε παραπάνω είναι ένας πολύ πιο γενικός κανόνας.

Καμπύλη Λόρενζ και συντελεστής Γκίνι

Καμπύλες Λόρεντζ για ορισμένες κατανομές Παρέτο. Η περίπτωση α = ∞ αντιστοιχεί σε απόλυτα ίση κατανομή (G = 0) και η γραμμή α = 1 αντιστοιχεί σε πλήρη ανισότητα (G = 1)

Η καμπύλη Λόρενζ χρησιμοποιείται συχνά για να χαρακτηρίσει τις κατανομές εισοδήματος και πλούτου. Για οποιαδήποτε κατανομή, η καμπύλη Lorenz L(F) γράφεται ως προς το PDF f ή το CDF F ως εξής

L(F)=xmx(F)xf(x)dxxmxf(x)dx=0Fx(F)dF01x(F)dF

όπου x(F) είναι το αντίστροφο της CDF. Για την κατανομή Παρέτο,

x(F)=xm(1F)1α

και η καμπύλη Λόρεντζ υπολογίζεται ως εξής

L(F)=1(1F)11α,

Για 0<α1 ο παρονομαστής είναι άπειρος, οπότε L=0. Παραδείγματα της καμπύλης Lorenz για διάφορες κατανομές Pareto παρουσιάζονται στο γράφημα στα δεξιά.

Σύμφωνα με την Oxfam (2016) οι 62 πλουσιότεροι άνθρωποι έχουν τόσο πλούτο όσο και το φτωχότερο μισό του παγκόσμιου πληθυσμού.[35] Μπορούμε να υπολογίσουμε τον δείκτη Παρέτο που θα ίσχυε σε αυτή την κατάσταση. Αφήνοντας το ε ίσο με 62/(7×109) έχουμε:

L(1/2)=1L(1ε)

ή

1(1/2)11α=ε11α

Η λύση είναι ότι το α ισούται με περίπου 1,15 και ότι περίπου 9% του πλούτου ανήκει σε κάθε μία από τις δύο ομάδες. Αλλά στην πραγματικότητα το φτωχότερο 69% του παγκόσμιου ενήλικου πληθυσμού κατέχει μόνο περίπου το 3% του πλούτου.[36]

Ο συντελεστής Γκίνι είναι ένα μέτρο της απόκλισης της καμπύλης Λόρεντζ από τη γραμμή ισοκατανομής, η οποία είναι μια γραμμή που συνδέει τις τιμές [0, 0] και [1, 1], η οποία εμφανίζεται με μαύρο χρώμα (α = ∞) στο διάγραμμα Λόρεντζ στα δεξιά. Συγκεκριμένα, ο συντελεστής Γκίνι είναι το διπλάσιο του εμβαδού μεταξύ της καμπύλης Λόρεντζ και της γραμμής ισοκατανομής. Ο συντελεστής Γκίνι για την κατανομή Παρέτο υπολογίζεται (για α1) ως εξής

G=12(01L(F)dF)=12α1

Δημιουργία τυχαίων μεταβλητών

Τυχαία δείγματα μπορούν να παραχθούν με τη χρήση δειγματοληψίας αντίστροφου μετασχηματισμού. Δεδομένης μιας τυχαίας μεταβλητής U που αντλείται από την ομοιόμορφη κατανομή στο μοναδιαίο διάστημα [0, 1], η μεταβλητή T που δίνεται από τη σχέση

T=xmU1/α

είναι κατανεμημένη κατά Παρέτο.[37]

Εξωτερικοί σύνδεσμοι

Δείτε επίσης

Βιβλιογραφία

Παραπομπές

Πρότυπο:Reflist

Πηγές

Πρότυπο:Portal bar Πρότυπο:Authority control

  1. Πρότυπο:Cite journal
  2. Πρότυπο:Cite journal
  3. Πρότυπο:Cite journal
  4. Πρότυπο:Cite journal
  5. Πρότυπο:Cite web
  6. 6,0 6,1 6,2 6,3 Πρότυπο:Cite book
  7. S. Hussain, S.H. Bhatti (2018). Parameter estimation of Pareto distribution: Some modified moment estimators. Maejo International Journal of Science and Technology 12(1):11-27.
  8. Πρότυπο:Cite journal
  9. 9,0 9,1 9,2 Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  10. 10,0 10,1 10,2 10,3 Johnson, Kotz, and Balakrishnan (1994), (20.4).
  11. Πρότυπο:Cite book
  12. 12,0 12,1 Πρότυπο:Cite book "The densities (4.3) are sometimes called after the economist Pareto. It was thought (rather naïvely from a modern statistical standpoint) that income distributions should have a tail with a density ~ Axα as x → ∞".
  13. Πρότυπο:Cite journal
  14. Πρότυπο:Cite book
  15. Dallas, A. C. "Characterizing the Pareto and power distributions." Annals of the Institute of Statistical Mathematics 28.1 (1976): 491-497.
  16. Πρότυπο:Cite thesis section 5.3.1.
  17. Πρότυπο:Cite web
  18. 18,0 18,1 18,2 18,3 Πρότυπο:Cite journal
  19. Πρότυπο:Cite journal
  20. Πρότυπο:Cite journal
  21. Πρότυπο:Cite journal
  22. Πρότυπο:Cite web
  23. Πρότυπο:Cite web
  24. Πρότυπο:Cite web
  25. 25,0 25,1 25,2 25,3 25,4 Πρότυπο:Cite journal
  26. Πρότυπο:Cite journal
  27. Πρότυπο:Cite journal
  28. Πρότυπο:Cite journal
  29. Πρότυπο:Cite journal
  30. Kleiber and Kotz (2003): p. 94.
  31. Πρότυπο:Cite journal
  32. Original research inline - December 2020
  33. CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]
  34. Πρότυπο:Cite journal
  35. Πρότυπο:Cite web
  36. Πρότυπο:Cite web
  37. Πρότυπο:Cite book