Επικρατούσα τιμή

Από testwiki
Αναθεώρηση ως προς 20:52, 17 Μαρτίου 2025 από τον imported>ΣΙΤ (growthexperiments-addlink-summary-summary:3|0|0)
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Στη στατιστική, η Επικρατούσα τιμή είναι η τιμή που εμφανίζεται συχνότερα σε ένα σύνολο τιμών δεδομένων[1]. Εάν η Πρότυπο:Mvar είναι μια διακριτή τυχαία μεταβλητή, η λειτουργία είναι η τιμή Πρότυπο:Mvar στην οποία η συνάρτηση μάζας πιθανότητας παίρνει τη μέγιστη τιμή της (δηλαδή, Πρότυπο:Math). Με άλλα λόγια, είναι η τιμή που είναι πιο πιθανό να δειγματοληπτηθεί.

Όπως ο στατιστικός μέσος όρος και η διάμεσος, η Επικρατούσα τιμή είναι ένας τρόπος έκφρασης, σε έναν (συνήθως) ενιαίο αριθμό, σημαντικών πληροφοριών σχετικά με μια τυχαία μεταβλητή ή έναν πληθυσμό. Η αριθμητική τιμή της Επικρατούσας τιμής είναι η ίδια με εκείνη του μέσου όρου και της διαμέσου σε μια κανονική κατανομή, ενώ μπορεί να είναι πολύ διαφορετική σε πολύ στρεβλές κατανομές.

Η επικρατούσα τιμή δεν είναι απαραίτητα μοναδικός σε μια δεδομένη διακριτή κατανομή, καθώς η συνάρτηση μάζας πιθανότητας μπορεί να λάβει την ίδια μέγιστη τιμή σε διάφορα σημεία Πρότυπο:Math, Πρότυπο:Math, κλπ. Η πιο ακραία περίπτωση εμφανίζεται στις ομοιόμορφες κατανομές, όπου όλες οι τιμές εμφανίζονται εξίσου συχνά.

Ως επικρατούσα τιμή μιας συνεχούς κατανομής πιθανότητας θεωρείται συχνά κάθε τιμή x στην οποία η συνάρτηση πυκνότητας πιθανότητας έχει τοπικά μέγιστη τιμή.[2] Όταν η συνάρτηση πυκνότητας πιθανότητας μιας συνεχούς κατανομής έχει πολλαπλά τοπικά μέγιστα, συνηθίζεται να αναφέρονται όλα τα τοπικά μέγιστα ως επικρατούσες τιμές της κατανομής, οπότε κάθε κορυφή είναι επικρατούσα τιμή. Μια τέτοια συνεχής κατανομή ονομάζεται πολύτροπη σε αντίθεση με την μονοτροπική τιμή).

Στις συμμετρικές μονοτροπικές κατανομές, όπως η κανονική κατανομή, η μέση τιμή (αν ορίζεται), η διάμεσος και η επικρατούσα τιμή συμπίπτουν. Για δείγματα, εάν είναι γνωστό ότι προέρχονται από συμμετρική μονοτροπική κατανομή, η μέση τιμή του δείγματος μπορεί να χρησιμοποιηθεί ως εκτίμηση της επικρατούσας τιμής πληθυσμού.

Επικρατούσα τιμή ενός δείγματος

Η Επικρατούσα τιμή ενός δείγματος είναι το στοιχείο που εμφανίζεται συχνότερα στη συλλογή. Παραδείγματος χάριν, ο επικρατούσα τιμή του δείγματος [1, 3, 6, 6, 6, 6, 6, 7, 7, 12, 12, 17] είναι 6. Δεδομένου του καταλόγου δεδομένων [1, 1, 2, 4, 4] ο επικρατούσα τιμή του δεν είναι μοναδική. Ένα σύνολο δεδομένων, σε μια τέτοια περίπτωση, λέγεται ότι είναι διτροπικό, ενώ ένα σύνολο με περισσότερους από δύο τρόπους μπορεί να περιγραφεί ως πολύτροπο.

Σε ένα δείγμα από μια συνεχή κατανομή, όπως [0,935..., 1,211..., 2,430..., 3,668..., 3,874...], η έννοια είναι άχρηστη στην ακατέργαστη μορφή της, καθώς καμία τιμή δεν θα είναι ακριβώς ίδια, οπότε κάθε τιμή θα εμφανίζεται ακριβώς μία φορά. Προκειμένου να εκτιμηθεί ο η επικρατούσα τιμή της υποκείμενης κατανομής, η συνήθης πρακτική είναι η διακριτοποίηση των δεδομένων με την ανάθεση τιμών συχνότητας σε διαστήματα ίσης απόστασης, όπως για την κατασκευή ενός ιστογράμματος, αντικαθιστώντας ουσιαστικά τις τιμές από τα μέσα σημεία των διαστημάτων στα οποία αντιστοιχούν. Η επικρατούσα τιμή είναι τότε η τιμή στην οποία το ιστόγραμμα φτάνει στην κορυφή του. Για δείγματα μικρού ή μεσαίου μεγέθους, το αποτέλεσμα αυτής της διαδικασίας είναι ευαίσθητο στην επιλογή του πλάτους των διαστημάτων, εάν επιλεγεί πολύ στενό ή πολύ ευρύ- συνήθως θα πρέπει να έχουμε ένα σημαντικό κλάσμα των δεδομένων συγκεντρωμένο σε σχετικά μικρό αριθμό διαστημάτων (5 έως 10), ενώ το κλάσμα των δεδομένων που πέφτει εκτός αυτών των διαστημάτων είναι επίσης σημαντικό. Μια εναλλακτική προσέγγιση είναι η εκτίμηση πυκνότητας πυρήνα, η οποία ουσιαστικά θολώνει τα σημειακά δείγματα για να παράγει μια συνεχή εκτίμηση της συνάρτησης πυκνότητας πιθανότητας, η οποία μπορεί να παρέχει μια εκτίμηση της επικρατούσας τιμής.

Το ακόλουθο παράδειγμα κώδικα MATLAB (ή Octave) υπολογίζει τον τρόπο λειτουργίας ενός δείγματος:

X = sort(x);                               % x είναι ένα σύνολο δεδομένων με διανύσματα στηλών
indices   =  find(diff([X, realmax]) > 0); % δείκτες όπου οι επαναλαμβανόμενες τιμές αλλάζουν
[modeL,i] =  max (diff([0, indices]));     % μεγαλύτερο μήκος παραμονής επαναλαμβανόμενων τιμών
mode      =  X(indices(i));

Ο αλγόριθμος απαιτεί ως πρώτο βήμα την ταξινόμηση του δείγματος σε αύξουσα σειρά. Στη συνέχεια υπολογίζει τη διακριτή παράγωγο του ταξινομημένου καταλόγου και βρίσκει τους δείκτες όπου η παράγωγος αυτή είναι θετική. Στη συνέχεια υπολογίζει τη διακριτή παράγωγο αυτού του συνόλου δεικτών, εντοπίζει το μέγιστο αυτής της παραγώγου των δεικτών και τέλος αξιολογεί το ταξινομημένο δείγμα στο σημείο όπου εμφανίζεται αυτό το μέγιστο, το οποίο αντιστοιχεί στο τελευταίο μέλος της έκτασης των επαναλαμβανόμενων τιμών.

Σύγκριση του μέσου όρου, της διάμεσου και της Επικρατούσας τιμής

Βλ. επίσης: Μέση τιμή και διάμεσος

Γεωμετρική απεικόνιση του τρόπου, της διαμέσου και της μέσης τιμής μιας αυθαίρετης συνάρτησης πυκνότητας πιθανότητας.[3]
Σύγκριση κοινών μέσων τιμών { 1, 2, 2, 3, 4, 7, 9 }
Τύπος Περιγραφή Παράδειγμα Αποτέλεσμα
Μέση τιμή θροισμα των τιμών ενός συνόλου δεδομένων διαιρούμενο με τον αριθμό των τιμών (1+2+2+3+4+7+9) / 7 4
Διάμεσος Μέση τιμή που διαχωρίζει το μεγαλύτερο και το μικρότερο μισό ενός συνόλου δεδομένων 1, 2, 2, 3, 4, 7, 9 3
Επικρατούσα τιμή Πιο συχνή τιμή σε ένα σύνολο δεδομένων 1, 2, 2, 3, 4, 7, 9 2

Χρήση

Σε αντίθεση με τον μέσο όρο και τη διάμεσο, η έννοια του τρόπου λειτουργίας έχει επίσης νόημα για «ονομαστικά δεδομένα» (δηλαδή, δεν αποτελούνται από αριθμητικές τιμές στην περίπτωση του μέσου όρου ή ακόμη και από διατεταγμένες τιμές στην περίπτωση της διάμεσου). Παραδείγματος χάριν, λαμβάνοντας ένα δείγμα κορεατικών οικογενειακών ονομάτων, μπορεί κανείς να διαπιστώσει ότι το «Kim» εμφανίζεται συχνότερα από οποιοδήποτε άλλο όνομα. Τότε το «Kim» θα ήταν η επικρατούσα τιμή του δείγματος. Σε οποιοδήποτε σύστημα ψηφοφορίας όπου η πλειονότητα καθορίζει τη νίκη, μια ενιαία τυπική τιμή καθορίζει τον νικητή, ενώ ένα αποτέλεσμα πολύτροπο θα απαιτούσε να λάβει χώρα κάποια διαδικασία ισοπαλίας.

Σε αντίθεση με τη διάμεσο, η έννοια του τρόπου λειτουργίας έχει νόημα για οποιαδήποτε τυχαία μεταβλητή που λαμβάνει τιμές από έναν διανυσματικό χώρο, συμπεριλαμβανομένων των πραγματικών αριθμών (ένας μονοδιάστατος διανυσματικός χώρος) και των ακεραίων αριθμών (οι οποίοι μπορούν να θεωρηθούν ενσωματωμένοι στους πραγματικούς αριθμούς). Επί παραδείγματι, μια κατανομή σημείων στο επίπεδο θα έχει τυπικά μια μέση τιμή και μία επικρατούσα τιμή , αλλά η έννοια της διαμέσου δεν ισχύει. Η διάμεσος έχει νόημα όταν υπάρχει γραμμική σειρά στις πιθανές τιμές. Γενικεύσεις της έννοιας της διαμέσου σε χώρους υψηλότερων διαστάσεων είναι η γεωμετρική διάμεσος και το κεντρικό σημείο.

Μοναδικότητα και καθορισμός

Σε ορισμένες κατανομές πιθανοτήτων, η αναμενόμενη τιμή μπορεί να είναι άπειρη ή απροσδιόριστη, αλλά αν είναι ορισμένη, είναι μοναδική. Η μέση τιμή ενός (πεπερασμένου) δείγματος είναι πάντα ορισμένη. Η διάμεσος είναι η τιμή που είναι τέτοια ώστε τα κλάσματα που δεν την υπερβαίνουν και δεν την υπολείπονται είναι το καθένα τουλάχιστον 1/2. Δεν είναι απαραίτητα μοναδική, αλλά ποτέ δεν είναι άπειρη ή εντελώς απροσδιόριστη. Για ένα δείγμα δεδομένων είναι η «μέση» τιμή όταν ο κατάλογος των τιμών διατάσσεται κατά αύξουσα τιμή, όπου συνήθως για έναν κατάλογο ζυγού μήκους λαμβάνεται ο αριθμητικός μέσος όρος των δύο τιμών που βρίσκονται πιο κοντά στη «μέση». Τέλος, όπως ειπώθηκε προηγουμένως, ο τρόπος δεν είναι απαραίτητα μοναδικός. Ορισμένες παθολογικές κατανομές (για παράδειγμα, η κατανομή Κάντορ) δεν έχουν καθόλου καθορισμένο τρόπο.[4] Για ένα πεπερασμένο δείγμα δεδομένων, ο τρόπος είναι μία (ή περισσότερες) από τις τιμές του δείγματος.

Ιδιότητες

Υποθέτοντας ότι είναι καθορισμένες και για λόγους απλότητας μοναδικές, οι ακόλουθες είναι μερικές από τις πιο ενδιαφέρουσες ιδιότητες.

  • Και οι τρεις μετρήσεις έχουν την ακόλουθη ιδιότητα: Εάν η τυχαία μεταβλητή (ή κάθε τιμή από το δείγμα) υποβληθεί στον γραμμικό ή συγγενή μετασχηματισμό, ο οποίος αντικαθιστά το Πρότυπο:Mvar με Πρότυπο:Math, το ίδιο ισχύει και για τη μέση τιμή, τη διάμεσο και την μονοεπικρατούσα τιμή.
  • Εκτός από εξαιρετικά μικρά δείγματα, η επικρατούσα τιμή είναι ανεπηρέαστη από «ακραίες τιμές» (όπως περιστασιακές, σπάνιες, ψευδείς πειραματικές μετρήσεις). Η διάμεσος είναι επίσης πολύ ανθεκτική στην παρουσία ακραίων τιμών, ενώ ο μέσος όρος είναι μάλλον ευαίσθητος.
  • Στις συνεχείς μονότροπες κατανομές η διάμεσος βρίσκεται συχνά μεταξύ του μέσου όρου και της επικρατούσας τιμής , περίπου στο ένα τρίτο της διαδρομής από τον μέσο όρο στον τρόπο. Σε έναν τύπο, median ≈ (2 × mean + mode)/3. Αυτός ο κανόνας, που οφείλεται στον Καρλ Πίρσον, εφαρμόζεται συχνά σε ελαφρώς μη συμμετρικές κατανομές που μοιάζουν με κανονική κατανομή, αλλά δεν ισχύει πάντα και γενικά τα τρία στατιστικά στοιχεία μπορούν να εμφανίζονται με οποιαδήποτε σειρά.[5][6]
  • Για μονότροπες κατανομές, ο τρόπος βρίσκεται εντός Πρότυπο:Radic τυπικών αποκλίσεων του μέσου όρου και η μέση τετραγωνική απόκλιση γύρω από την επικρατούσα τιμή είναι μεταξύ της τυπικής απόκλισης και του διπλάσιου της τυπικής απόκλισης.[7]

Παράδειγμα ασύμμετρης κατανομής

Ένα παράδειγμα ασύμμετρης κατανομής είναι ο προσωπικός πλούτος: Λίγοι άνθρωποι είναι πολύ πλούσιοι, αλλά μεταξύ αυτών κάποιοι είναι εξαιρετικά πλούσιοι. Ωστόσο, πολλοί είναι μάλλον φτωχοί.

Σύγκριση του μέσου όρου, της διάμεσου και του τρόπου λειτουργίας δύο λογαριθμοκανονικών κατανομών με διαφορετική ασύμμετρία.

Μια γνωστή κατηγορία κατανομών που μπορεί να είναι αυθαίρετα λοξή, είναι η κατανομή log-κανονική. Προκύπτει από το μετασχηματισμό μιας τυχαίας μεταβλητής Πρότυπο:Mvar που έχει κανονική κατανομή σε τυχαία μεταβλητή Πρότυπο:Math. Τότε ο λογάριθμος της τυχαίας μεταβλητής Πρότυπο:Mvar έχει κανονική κατανομή, εξ ου και το όνομα.

Θεωρώντας ότι η μέση τιμή μ του Πρότυπο:Mvar είναι 0, η διάμεσος του Πρότυπο:Mvar θα είναι 1, ανεξάρτητα από την τυπική απόκλιση σ του Πρότυπο:Mvar . Αυτό συμβαίνει επειδή το Πρότυπο:Mvar έχει συμμετρική κατανομή, οπότε η διάμεσος του είναι επίσης 0. Ο μετασχηματισμός από το Πρότυπο:Mvar στο Πρότυπο:Mvar είναι μονοτονικός και έτσι βρίσκουμε τη διάμεσο Πρότυπο:Math για το Πρότυπο:Mvar.

Όταν η Πρότυπο:Mvar έχει τυπική απόκλιση σ = 0,25, η κατανομή της Πρότυπο:Mvar είναι ασθενώς λοξή. Χρησιμοποιώντας τους τύπους για τη λογαριθμοκανονική κατανομή, βρίσκουμε:

mean=eμ+σ2/2=e0+0.252/21.032mode=eμσ2=e00.2520.939median=eμ=e0=1

Πράγματι, η διάμεσος βρίσκεται περίπου στο ένα τρίτο της διαδρομής από τη μέση τιμή προς τον τρόπο λειτουργίας.

Όταν Πρότυπο:Mvar έχει μεγαλύτερη τυπική απόκλιση, Πρότυπο:Math, η κατανομή της Πρότυπο:Mvar είναι έντονα λοξή. Τώρα

mean=eμ+σ2/2=e0+12/21.649mode=eμσ2=e0120.368median=eμ=e0=1

Εδώ, ο κανόνας του Πίρσον αποτυγχάνει.

Μονότροπες κατανομές

Μπορεί να αποδειχθεί για μια μονότροπη κατανομή ότι η διάμεσος X~ και η μέση τιμή X¯ βρίσκονται εντός (3/5)1/2 ≈ 0,7746 τυπικών αποκλίσεων μεταξύ τους.[8] Σε σύμβολα,

|X~X¯|σ(3/5)1/2

όπου || είναι η απόλυτη τιμή.

Μια παρόμοια σχέση ισχύει μεταξύ της διάμεσου και της επικρατούσας τιμής  : βρίσκονται σε απόσταση 31/2 ≈ 1,732 τυπικών αποκλίσεων η μία από την άλλη:

|X~mode|σ31/2.

Ιστορία

Ο όρος mode προέρχεται από τον Καρλ Πίρσον το 1895[9].

Ο Πίρσον χρησιμοποιεί τον όρο mode (Επικρατούσα τιμή) εναλλακτικά με τον όρο μέγιστη συντεταγμένη. Σε μια υποσημείωση αναφέρει: «Βρήκα ότι είναι βολικό να χρησιμοποιώ τον όρο "mode"[10] (επικρατούσα τιμή) για την "abscissa" (τετριμμένη) που αντιστοιχεί στην κανονική της μέγιστης συχνότητας».

Εξωτερικοί σύνδεσμοι

Δείτε επίσης

Βιβλιογραφία

Παραπομπές

Πρότυπο:Reflist

Πηγές

Πρότυπο:Portal bar Πρότυπο:Authority control