Ανάλυση αποκλιμακωμένης διακύμανσης

Από testwiki
Αναθεώρηση ως προς 15:04, 29 Δεκεμβρίου 2024 από τον imported>ΣΙΤ (growthexperiments-addlink-summary-summary:2|0|0)
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Στις στοχαστικές διεργασίες, τη θεωρία του χάους και την ανάλυση χρονοσειρών, η ανάλυση αποκλιμακωμένης διακύμανσης (DFA) είναι μια μέθοδος για τον προσδιορισμό της στατιστικής αυτοσυσχέτισης ενός σήματος. Είναι χρήσιμη για την ανάλυση χρονοσειρών που φαίνεται να είναι διεργασίες μακράς μνήμης (αποκλίνων χρόνος συσχέτισης, π.χ. συνάρτηση αυτοσυσχέτισης με φθίνουσα συνάρτηση νόμου ισχύος) ή θόρυβος 1/f.

Ο εκθέτης που προκύπτει είναι παρόμοιος με τον εκθέτη Χερστ, με τη διαφορά ότι η DFA μπορεί επίσης να εφαρμοστεί σε σήματα των οποίων τα υποκείμενα στατιστικά στοιχεία (όπως ο μέσος όρος και η διακύμανση) ή η δυναμική είναι μη στάσιμα (μεταβάλλονται με το χρόνο). Σχετίζεται με μέτρα που βασίζονται σε φασματικές τεχνικές, όπως η αυτοσυσχέτιση και ο μετασχηματισμός Φουριέ.

Οι Πενγκ κ.ά. εισήγαγαν την DFA το 1994 σε μια εργασία που έχει αναφερθεί πάνω από 3.000 φορές έως το 2022[1] και αποτελεί μια επέκταση της (συνηθισμένης) ανάλυσης διακύμανσης (FA), η οποία επηρεάζεται από μη σταθερότητες.

Ορισμός

Η DFA σε μια διαδικασία κίνησης Μπράουν, με αυξανόμενες τιμές του n.

Αλγόριθμος

Έστω: μια χρονοσειρά x1,x2,...,xN.

Υπολογίζουμε τη μέση τιμή του x=1Nt=1Nxt.

Αθροίστε το σε μια διαδικασία Xt=i=1t(xix). Πρόκειται για το αθροιστικό άθροισμα, ή προφίλ, της αρχικής χρονοσειράς. Για παράδειγμα, το προφίλ μιας i.i.d.[2] λευκός θόρυβος είναι ένας τυπικός τυχαίος περίπατος[3].

Επιλέξτε ένα σύνολο T={n1,...,nk} ακεραίων αριθμών, έτσι ώστε n1<n2<<nk, το μικρότερο n14, το μεγαλύτερο nkN, και η ακολουθία να είναι περίπου ομοιόμορφα κατανεμημένη στην κλίμακα log: log(n2)log(n1)log(n3)log(n2). Με άλλα λόγια, είναι κατά προσέγγιση μια γεωμετρική πρόοδος.[4]

Για κάθε nT, διαιρέστε την ακολουθία Xt σε διαδοχικά τμήματα μήκους n. Μέσα σε κάθε τμήμα, υπολογίστε την ευθεία προσαρμογή των ελαχίστων τετραγώνων (την τοπική τάση). Έστω Y1,n,Y2,n,...,YN,n η προκύπτουσα τμηματικά γραμμική προσαρμογή.

Υπολογίστε τη μέση τετραγωνική απόκλιση από την τοπική τάση (τοπική διακύμανση)

F(n,i)=1nt=in+1in+n(XtYt,n)2.

Και η ρίζα μέσου τετραγώνου τους είναι η συνολική διακύμανση:

F(n)=1N/ni=1N/nF(n,i)2.

(Εάν το N δεν διαιρείται με το n, τότε μπορεί κανείς είτε να απορρίψει το υπόλοιπο της ακολουθίας, είτε να επαναλάβει τη διαδικασία στην αντίστροφη ακολουθία, και στη συνέχεια να πάρει τη ρίζα του μέσου τετραγώνου τους.[5])

Σχεδιάστε τη γραφική παράσταση log-log lognlogF(n).[6][7]

Ερμηνεία

Μια ευθεία γραμμή με κλίση α στο γράφημα log-log υποδηλώνει μια στατιστική αυτοσυγγένειατης μορφής F(n)nα. Δεδομένου ότι η F(n) αυξάνεται μονοτονικά με το n, έχουμε πάντα α>0.

Ο εκθέτης κλιμάκωσης α είναι μια γενίκευση του εκθέτης Χερστ, με την ακριβή τιμή του να δίνει πληροφορίες σχετικά με τις αυτοσυσχετίσεις της σειράς:

  • α<1/2: αντι-συσχέτιση
  • α1/2: ασυσχέτιστος, λευκός θόρυβος
  • α1: 1/f-noise, ροζ θόρυβος
  • α>1: μη στάσιμος, απεριόριστος
  • α3/2: καφέ θόρυβος

Επειδή η αναμενόμενη μετατόπιση σε έναν ασυσχέτιστο τυχαίο περίπατο μήκους N αυξάνεται όπως N, ένας εκθέτης 12 θα αντιστοιχούσε σε ασυσχέτιστο λευκό θόρυβο. Όταν ο εκθέτης είναι μεταξύ 0 και 1, το αποτέλεσμα είναι κλασματικός θόρυβος Γκάους.

Παγίδες κατά την ερμηνεία

Παρότι ο αλγόριθμος DFA παράγει πάντα έναν θετικό αριθμό α για οποιαδήποτε χρονοσειρά, αυτό δεν συνεπάγεται απαραίτητα ότι η χρονοσειρά είναι αυτοομοιόμορφη. Η αυτοομοιότητα απαιτεί το γράφημα log-log να είναι επαρκώς γραμμικό σε ένα ευρύ φάσμα του n. Επιπλέον, αποδείχθηκε ότι ένας συνδυασμός τεχνικών που περιλαμβάνει την MLE, αντί των ελαχίστων τετραγώνων, προσεγγίζει καλύτερα τον εκθέτη κλιμάκωσης ή τον εκθέτη power-law.

Επιπλέον, υπάρχουν πολλά μεγέθη που μοιάζουν με εκθέτη κλιμάκωσης και μπορούν να μετρηθούν για μια αυτοομοιογενή χρονοσειρά, συμπεριλαμβανομένης της διάστασης του διαιρέτη και του εκθέτη Χερστ. Ως εκ τούτου, ο εκθέτης κλιμάκωσης α δεν είναι μια μορφοκλασματική διάσταση και δεν έχει ορισμένες επιθυμητές ιδιότητες που έχει η διάσταση Χάουσντορφ, αν και σε ορισμένες ειδικές περιπτώσεις σχετίζεται με τη διάσταση καταμέτρησης κουτιών για το γράφημα μιας χρονοσειράς.

Γενικεύσεις

Γενίκευση σε πολυωνυμικές τάσεις (DFA υψηλότερης τάξης)

Ο τυπικός αλγόριθμος DFA που παρατίθεται παραπάνω αφαιρεί μια γραμμική τάση σε κάθε τμήμα. Εάν αφαιρέσουμε μια πολυωνυμική τάση βαθμού-n σε κάθε τμήμα, ονομάζεται DFAn ή DFA ανώτερης τάξης.[8]

Δεδομένου ότι το Xt είναι ένα αθροιστικό άθροισμα του xtx, μια γραμμική τάση στο Xt είναι μια σταθερή τάση στο xtx, η οποία είναι μια σταθερή τάση στο xt (ορατή ως μικρά τμήματα "επίπεδων οροπεδίων"). Από αυτή την άποψη, το DFA1 αφαιρεί τον μέσο όρο από τα τμήματα της χρονοσειράς xt πριν από την ποσοτικοποίηση της διακύμανσης.

Παρομοίως, μια τάση βαθμού n στο Xt είναι μια τάση βαθμού (n-1) στο xt. Παραδείγματος χάριν, το DFA1 αφαιρεί τις γραμμικές τάσεις από τα τμήματα της χρονοσειράς xt πριν από την ποσοτικοποίηση της διακύμανσης, το DFA1 αφαιρεί τις παραβολικές τάσεις από το xt, και ούτω καθεξής.

Η ανάλυση Χερστ R/S αφαιρεί τις σταθερές τάσεις της αρχικής ακολουθίας και, επομένως, ως προς την αποσύνδεσή της είναι ισοδύναμη με την DFA1.

Γενίκευση σε διαφορετικές χρονικές στιγμές ("πολυκμορφολασματικό DFA")

Το DFA μπορεί να γενικευτεί υπολογίζοντας

Fq(n)=(1N/ni=1N/nF(n,i)q)1/q.

και στη συνέχεια κατασκευάζουμε τη γραφική παράσταση log-log του lognlogFq(n), Αν υπάρχει ισχυρή γραμμικότητα στη γραφική παράσταση του lognlogFq(n), τότε η κλίση αυτή είναι α(q).[9] Η DFA είναι η ειδική περίπτωση όπου q=2.

Τα πολυμορφοκλασματικά συστήματα κλιμακώνονται ως συνάρτηση Fq(n)nα(q). Στην ουσία, οι εκθέτες κλιμάκωσης δεν χρειάζεται να είναι ανεξάρτητοι από την κλίμακα του συστήματος. Συγκεκριμένα, η DFA μετρά την κλιμάκωση-συμπεριφορά των διακυμάνσεων της δεύτερης στιγμής.

Οι Καντελχάρντ κ.ά. προόριζαν αυτόν τον εκθέτη κλιμάκωσης ως γενίκευση του κλασικού εκθέτη Χερστ. Ο κλασικός εκθέτης Χερστ αντιστοιχεί σε H=α(2) για σταθερές περιπτώσεις και H=α(2)1 για μη σταθερές περιπτώσεις.[9][10][11]

Εφαρμογές

Η μέθοδος DFA έχει εφαρμοστεί σε πολλά συστήματα, π.χ. ακολουθίες DNA,[12][13] νευρωνικές ταλαντώσεις,[11] ανίχνευση παθολογίας ομιλίας,[14] διακύμανση καρδιακών παλμών σε διάφορα στάδια ύπνου,[15] και ανάλυση προτύπων συμπεριφοράς ζώων[16].

Μελετήθηκε η επίδραση των τάσεων στην DFA.[17]

Σχέσεις με άλλες μεθόδους, για συγκεκριμένους τύπους σημάτων

Για σήματα με αυτοσυσχέτιση με νόμο ισχύος

Στην περίπτωση των αυτοσυσχετίσεων με νόμο δύναμης, η συνάρτηση συσχέτισης διασπάται με εκθέτη γ: C(L)Lγ . Επιπλέον, το φάσμα ισχύος διασπάται ως P(f)fβ . Οι τρεις εκθέτες σχετίζονται με:

  • γ=22α
  • β=2α1 και
  • γ=1β.

Οι σχέσεις μπορούν να προκύψουν χρησιμοποιώντας το θεώρημα Βίνερ-Κίντσιν. Η σχέση της DFA με τη μέθοδο του φάσματος ισχύος έχει μελετηθεί καλά.[18]

Έτσι, το α συνδέεται με την κλίση του φάσματος ισχύος β και χρησιμοποιείται για την περιγραφή του χρώματος του θορύβου μέσω αυτής της σχέσης: α=(β+1)/2.

Για κλασματικό θόρυβο του Γκάους

Για κλασματικό θόρυβο Γκάους (FGN), έχουμε β[1,1], και επομένως α[0,1], και β=2H1, όπου H είναι ο εκθέτης Χερστ. Το α για το FGN είναι ίσο με H.[19]

Για κλασματική κίνηση Μπράουν

Για κλασματική κίνηση Brown (FBM), έχουμε β[1,3], και επομένως α[1,2], και β=2H+1, όπου H είναι ο εκθέτης Χερστ. Το α για FBM είναι ίσο με H+1.[10] Σε αυτό το πλαίσιο, η FBM είναι το αθροιστικό άθροισμα ή το ολοκλήρωμα της FGN, επομένως, οι εκθέτες των φασμάτων ισχύος διαφέρουν κατά 2.

Εξωτερικοί σύνδεσμοι

Δείτε επίσης

Παραπομπές

Πρότυπο:Reflist

Πρότυπο:Authority control Πρότυπο:Portal bar