Πίνακας σχεδιασμού

Από testwiki
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Στη στατιστική και ιδίως στην ανάλυση παλινδρόμησης, ένας πίνακας σχεδιασμού[1], γνωστός επίσης ως πίνακας μοντέλου ή πίνακας παλινδρόμησης και συχνά συμβολιζόμενος με Χ, είναι ένας πίνακας τιμών των επεξηγηματικών μεταβλητών ενός συνόλου αντικειμένων. Κάθε γραμμή αντιπροσωπεύει ένα μεμονωμένο αντικείμενο, ενώ οι διαδοχικές στήλες αντιστοιχούν στις μεταβλητές και τις συγκεκριμένες τιμές τους για το συγκεκριμένο αντικείμενο. Ο πίνακας σχεδιασμού χρησιμοποιείται σε ορισμένα στατιστικά μοντέλα, π.χ. στο γενικό γραμμικό μοντέλο.[2][3][4] Μπορεί να περιέχει μεταβλητές δείκτες (μονάδες και μηδενικά) που υποδηλώνουν τη συμμετοχή σε ομάδες σε μια ANOVA, ή μπορεί να περιέχει τιμές συνεχών μεταβλητών[5].

Ο πίνακας σχεδιασμού περιέχει δεδομένα σχετικά με τις ανεξάρτητες μεταβλητές (που ονομάζονται επίσης επεξηγηματικές μεταβλητές), σε ένα στατιστικό μοντέλο που προορίζεται να εξηγήσει τα παρατηρούμενα δεδομένα για μια μεταβλητή απόκρισης (που συχνά ονομάζεται εξαρτημένη μεταβλητή). Η θεωρία που σχετίζεται με τέτοια μοντέλα χρησιμοποιεί τον πίνακα σχεδιασμού ως είσοδο σε κάποια γραμμική άλγεβρα : Δείτε για παράδειγμα τη γραμμική παλινδρόμηση. Ένα αξιοσημείωτο χαρακτηριστικό της έννοιας του πίνακα σχεδιασμού είναι ότι μπορεί να αναπαραστήσει έναν αριθμό διαφορετικών πειραματικών σχεδίων και στατιστικών μοντέλων, π.χ. ANOVA, ANCOVA[6][7] και γραμμική παλινδρόμηση.

Ορισμός

Ο πίνακας σχεδιασμού ορίζεται ως ένας πίνακας X τέτοιος ώστε Xijjth στήλη της ith γραμμής του X) αντιπροσωπεύει την τιμή της jth μεταβλητής που σχετίζεται με το ith αντικείμενο.

Ένα μοντέλο παλινδρόμησης μπορεί να αναπαρασταθεί με πολλαπλασιασμό πινάκων της ακόλουθης μορφής

y=Xβ+e,

όπου X είναι ο πίνακας σχεδιασμού, β είναι ένα διάνυσμα των συντελεστών του μοντέλου (ένας για κάθε μεταβλητή), e είναι ένα διάνυσμα τυχαίων σφαλμάτων με μέση τιμή μηδέν και y είναι το διάνυσμα των προβλεπόμενων εξόδων για κάθε αντικείμενο.

Μέγεθος

Ο πίνακας σχεδιασμού έχει διάσταση n-επί-p, όπου n είναι ο αριθμός των παρατηρούμενων δειγμάτων και p είναι ο αριθμός των μεταβλητών (χαρακτηριστικών) που μετρήθηκαν σε όλα τα δείγματα. [8][9]

Σε αυτή την αναπαράσταση οι διάφορες γραμμές αντιπροσωπεύουν συνήθως διαφορετικές επαναλήψεις ενός πειράματος, ενώ οι στήλες αντιπροσωπεύουν διαφορετικούς τύπους δεδομένων (π.χ. τα αποτελέσματα από συγκεκριμένους ανιχνευτές). Παραδείγματος χάριν, ας υποθέσουμε ότι διεξάγεται ένα πείραμα όπου 10 άτομα τραβάνε από το δρόμο και τους κάνουν 4 ερωτήσεις. Ο πίνακας δεδομένων Μ θα ήταν ένας πίνακας 10×4 (δηλαδή 10 γραμμές και 4 στήλες). Το δεδομένο στη γραμμή i και τη στήλη j αυτού του πίνακα θα ήταν η απάντηση του i th ατόμου στην j th ερώτηση.

Παραδείγματα

Αριθμητικός μέσος όρος

Ο πίνακας σχεδιασμού για έναν αριθμητικός μέσος είναι διάνυσμα στήλης, Πίνακας από μονάδες.

Απλή γραμμική παλινδρόμηση

Στην παρούσα ενότητα δίνεται ένα παράδειγμα απλής γραμμικής παλινδρόμησης - δηλαδή παλινδρόμησης με μία μόνο επεξηγηματική μεταβλητή - με επτά παρατηρήσεις[10]. Τα επτά σημεία δεδομένων είναι {yi, xi}, για i = 1, 2, …, 7. Το μοντέλο απλής γραμμικής παλινδρόμησης είναι

yi=β0+β1xi+εi,

όπου β0 είναι η y-τομή και β1 είναι η κλίση της γραμμής παλινδρόμησης. Το μοντέλο αυτό μπορεί να αναπαρασταθεί σε μορφή πίνακα ως εξής

[y1y2y3y4y5y6y7]=[1x11x21x31x41x51x61x7][β0β1]+[ε1ε2ε3ε4ε5ε6ε7]

όπου η πρώτη στήλη των 1s στον πίνακα σχεδιασμού επιτρέπει την εκτίμηση της y-διατομής, ενώ η δεύτερη στήλη περιέχει τις x-τιμές που σχετίζονται με τις αντίστοιχες y-τιμές. Ο πίνακας του οποίου οι στήλες είναι 1 και x σε αυτό το παράδειγμα είναι ο πίνακας σχεδιασμού.

Πολλαπλή παλινδρόμηση

Αυτή η ενότητα περιέχει ένα παράδειγμα πολλαπλής παλινδρόμησης με δύο συνυπολογιζόμενες μεταβλητές (επεξηγηματικές μεταβλητές): w και x. Έστω και πάλι ότι τα δεδομένα αποτελούνται από επτά παρατηρήσεις και ότι για κάθε παρατηρούμενη τιμή που πρόκειται να προβλεφθεί ( y i (yi), παρατηρούνται επίσης οι τιμές wi και xiτων δύο συνυπολογιζόμενων μεταβλητών. Το υπόδειγμα που πρέπει να εξεταστεί είναι

yi=β0+β1wi+β2xi+εi

Το μοντέλο αυτό μπορεί να γραφεί σε όρους πίνακα ως εξής

[y1y2y3y4y5y6y7]=[1w1x11w2x21w3x31w4x41w5x51w6x61w7x7][β0β1β2]+[ε1ε2ε3ε4ε5ε6ε7]

Εδώ ο πίνακας 7×3 στη δεξιά πλευρά είναι ο πίνακας σχεδιασμού.

Μονόδρομος ANOVA (μοντέλο μέσων κυττάρων)

Αυτή η ενότητα περιέχει ένα παράδειγμα με ανάλυση διακύμανσης μονής κατεύθυνσης (ANOVA) με τρεις ομάδες και επτά παρατηρήσεις. Το δεδομένο σύνολο δεδομένων έχει τις τρεις πρώτες παρατηρήσεις που ανήκουν στην πρώτη ομάδα, τις δύο επόμενες παρατηρήσεις που ανήκουν στη δεύτερη ομάδα και τις δύο τελευταίες παρατηρήσεις που ανήκουν στην τρίτη ομάδα. Εάν το μοντέλο που πρέπει να προσαρμοστεί είναι μόνο ο μέσος όρος κάθε ομάδας, τότε το μοντέλο είναι

yij=μi+εij

το οποίο μπορεί να γραφτεί

[y1y2y3y4y5y6y7]=[100100100010010001001][μ1μ2μ3]+[ε1ε2ε3ε4ε5ε6ε7]

Σε αυτό το μοντέλο το μi αντιπροσωπεύει τον μέσο όρο της ith ομάδας.

Μονόδρομος ANOVA (αντιστάθμιση από την ομάδα αναφοράς)

Το μοντέλο ANOVA θα μπορούσε να γραφτεί ισοδύναμα ως εξής: κάθε παράμετρος της ομάδας τi είναι μια μετατόπιση από κάποια συνολική αναφορά. Συνήθως αυτό το σημείο αναφοράς θεωρείται ότι είναι μία από τις εξεταζόμενες ομάδες. Αυτό έχει νόημα στο πλαίσιο της σύγκρισης πολλαπλών ομάδων θεραπείας με μια ομάδα ελέγχου και η ομάδα ελέγχου θεωρείται η «αναφορά». Σε αυτό το παράδειγμα, η ομάδα 1 επιλέχθηκε ως ομάδα αναφοράς. Ως εκ τούτου, το μοντέλο που πρέπει να προσαρμοστεί είναι

yij=μ+τi+εij

με τον περιορισμό ότι τ1 είναι μηδέν.

[y1y2y3y4y5y6y7]=[100100100110110101101][μτ2τ3]+[ε1ε2ε3ε4ε5ε6ε7]

Σε αυτό το μοντέλο μ είναι ο μέσος όρος της ομάδας αναφοράς και τi είναι η διαφορά της ομάδας i από την ομάδα αναφοράς. Το τ1 δεν περιλαμβάνεται στον πίνακα επειδή η διαφορά του από την ομάδα αναφοράς (η ίδια) είναι αναγκαστικά μηδέν.

Δημοσιεύσεις

Πρότυπο:Refbegin

Δείτε επίσης

Εξωτερικοί σύνδεσμοι

Παραπομπές

Πρότυπο:Authority control Πρότυπο:Portal bar