Πίνακας Ευκλείδειας απόστασης

Από testwiki
Αναθεώρηση ως προς 02:56, 27 Ιανουαρίου 2025 από τον imported>ΣΙΤ (growthexperiments-addlink-summary-summary:2|0|0)
(διαφορά) ← Παλαιότερη αναθεώρηση | Τελευταία αναθεώρηση (διαφορά) | Νεότερη αναθεώρηση → (διαφορά)
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Στα μαθηματικά, ένας Πίνακας ευκλείδειας απόστασης είναι ένας πίνακας Πρότυπο:Math που αναπαριστά την απόσταση ενός συνόλου n σημείων στον ευκλείδειο χώρο. Για τα σημεία x1,x2,,xn στον Πρότυπο:Mvar-διάστατο χώρο Πρότυπο:Math, τα στοιχεία του πίνακα ευκλείδειων αποστάσεων Πρότυπο:Mvar τους δίνονται από τα τετράγωνα των αποστάσεων μεταξύ τους. Δηλαδή

A=(aij);aij=dij2=xixj2

όπου συμβολίζει την ευκλείδεια νόρμα στο Πρότυπο:Math.

A=[0d122d132d1n2d2120d232d2n2d312d3220d3n2dn12dn22dn320]

Στο πλαίσιο των πινάκων (όχι απαραίτητα ευκλείδειων) αποστάσεων, οι καταχωρήσεις ορίζονται συνήθως απευθείας ως αποστάσεις και όχι ως τα τετράγωνά τους. Ωστόσο, στην ευκλείδεια περίπτωση, τα τετράγωνα των αποστάσεων χρησιμοποιούνται για την αποφυγή υπολογισμού τετραγωνικών ριζών και για την απλοποίηση σχετικών θεωρημάτων και αλγορίθμων.

Οι πίνακες ευκλείδειας απόστασης είναι στενά συνδεδεμένοι με τους πίνακες Γκραμ (πίνακες τετραγωνικών γινομένων, που περιγράφουν τις νόρμες των διανυσμάτων και τις γωνίες μεταξύ τους). Οι τελευταίοι αναλύονται εύκολα με μεθόδους της γραμμικής άλγεβρας. Αυτό επιτρέπει τον χαρακτηρισμό των πινάκων ευκλείδειας απόστασης και την ανάκτηση των σημείων x1,x2,,xn που τον υλοποιούν. Μια υλοποίηση, αν υπάρχει, είναι μοναδική μέχρι άκαμπτους μετασχηματισμούς, δηλαδή μετασχηματισμούς του Ευκλείδειου χώρου που διατηρούν την απόσταση (περιστροφές, ανακλάσεις, μεταφορές).

Στις πρακτικές εφαρμογές, οι αποστάσεις είναι θορυβώδεις μετρήσεις ή προέρχονται από αυθαίρετες εκτιμήσεις ανομοιότητας (όχι απαραίτητα μετρικές). Ο στόχος μπορεί να είναι η οπτικοποίηση τέτοιων δεδομένων με σημεία στον ευκλείδειο χώρο, των οποίων ο πίνακας αποστάσεων προσεγγίζει όσο το δυνατόν καλύτερα έναν δεδομένο πίνακα ανομοιότητας - αυτό είναι γνωστό ως πολυδιάστατη κλιμάκωση. Εναλλακτικά, δεδομένου ότι δύο σύνολα δεδομένων έχουν ήδη αναπαρασταθεί με σημεία στον ευκλείδειο χώρο, μπορεί να τεθεί το ερώτημα πόσο παρόμοια είναι στο σχήμα τους, δηλαδή πόσο στενά μπορούν να συσχετιστούν με έναν μετασχηματισμό που διατηρεί την απόσταση - αυτό είναι η ανάλυση Προκρούστη. Ορισμένες από τις αποστάσεις μπορεί επίσης να λείπουν ή να έρχονται χωρίς ετικέτα (ως μη ταξινομημένο σύνολο ή πολυσύνολο αντί για πίνακα), οδηγώντας σε πιο σύνθετες αλγοριθμικές εργασίες, όπως το πρόβλημα της υλοποίησης γραφημάτων ή το πρόβλημα της στροφής (για σημεία σε μια γραμμή)[1][2].

Ιδιότητες

Από το γεγονός ότι η Ευκλείδεια απόσταση είναι μια μετρική, ο πίνακας Πρότυπο:Mvar έχει τις ακόλουθες ιδιότητες.

Στη διάσταση Πρότυπο:Mvar, ένας πίνακας ευκλείδειας απόστασης έχει βαθμό μικρότερο ή ίσο με Πρότυπο:Math. Αν τα σημεία x1,x2,,xn βρίσκονται σε γενική θέση, ο βαθμός είναι ακριβώς Πρότυπο:Math

Οι αποστάσεις μπορούν να συρρικνωθούν με οποιαδήποτε δύναμη για να προκύψει ένας άλλος πίνακας ευκλείδειας απόστασης. Δηλαδή, αν A=(aij) είναι ένας πίνακας ευκλείδειας απόστασης, τότε (aijs) είναι ένας πίνακας ευκλείδειας απόστασης για κάθε Πρότυπο:Math.[3]

Σχέση με τον πίνακα Γκραμ

Ο πίνακας Γκραμ μιας ακολουθίας σημείων x1,x2,,xn στον Πρότυπο:Mvar-διάστατο χώρο Πρότυπο:Math είναι ο Πρότυπο:Math πίνακας G=(gij) των τετραγωνικών γινομένων τους (εδώ ένα σημείο xi θεωρείται ως ένα διάνυσμα από το 0 στο σημείο αυτό):

gij=xixj=xixjcosθ, όπου θ είναι η γωνία μεταξύ του διανύσματος xi και xj.

Ειδικότερα

gii=xi2 είναι το τετράγωνο της απόστασης of xi από το 0.

Έτσι, ο πίνακας Γκραμ περιγράφει τις νόρμες και τις γωνίες των διανυσμάτων (από 0 έως) x1,x2,,xn.

Έστω X ο Πρότυπο:Math πίνακας που περιέχει x1,x2,,xn ως στήλες. Τότε

G=XTX, διότι gij=xiTxj (βλέποντας xi ως διάνυσμα στήλης).

Οι πίνακες που μπορούν να αναλυθούν ως XTX, δηλαδή πίνακες Γκραμ κάποιας ακολουθίας διανυσμάτων (στήλες του X), είναι ευρέως γνωστοί- συγκεκριμένα πρόκειται για θετικούς ημιορισμένους πίνακες[4].


Για να συσχετίσουμε τον πίνακα ευκλείδειας απόστασης με τον πίνακα Γκραμ, παρατηρούμε ότι

dij2=xixj2=(xixj)T(xixj)=xiTxi2xiTxj+xjTxj=gii2gij+gjj

Δηλαδή, οι νόρμες και οι γωνίες καθορίζουν τις αποστάσεις. Ας σημειωθεί ότι ο πίνακας Γκραμ περιέχει πρόσθετες πληροφορίες: αποστάσεις από το 0.

Αντίστροφα, οι αποστάσεις dij μεταξύ ζευγών σημείων Πρότυπο:Math x0,x1,,xn καθορίζουν τα γινόμενα τελείας μεταξύ των διανυσμάτων Πρότυπο:Mvar xix0 (Πρότυπο:Math):

gij=(xix0)(xjx0)=12(xix02+xjx02xixj2)=12(d0i2+d0j2dij2)

(αυτό είναι γνωστό ως ταυτότητα πόλωσης).

Χαρακτηρισμοί

Για έναν Πρότυπο:Math πίνακα Πρότυπο:Mvar, μια ακολουθία σημείων x1,x2,,xn στον Πρότυπο:Math-διάστατο ευκλείδειο χώρο Πρότυπο:Math ονομάζεται υλοποίηση του Πρότυπο:Mvar στον Πρότυπο:Math αν Πρότυπο:Mvar είναι ο πίνακας ευκλείδειας απόστασής τους. Μπορούμε να υποθέσουμε χωρίς απώλεια γενικότητας ότι x1=𝟎 (επειδή η μετατόπιση κατά x1 διατηρεί τις αποστάσεις).

Μαθηματικό θεώρημα [5]

Κριτήριο Σένμπεργκ,[6] ανεξάρτητα από τον Γιανγκ &Χάουζχολντερ [7]

Ένας συμμετρικός κοίλος Πρότυπο:Math πίνακας Πρότυπο:Mvar με πραγματικές εισόδους δέχεται μια υλοποίηση στο Πρότυπο:Math αν και μόνο αν ο Πρότυπο:Math πίνακας G=(gij)2i,jn ορίζεται από

gij=12(a1i2+a1j2aij2)

είναι θετικά ημιορισμένος και έχει βαθμό το πολύ Πρότυπο:Mvar.

Αυτό προκύπτει από την προηγούμενη συζήτηση επειδή ο Πρότυπο:Mvar είναι θετικά ημιορισμένος με βαθμό το πολύ Πρότυπο:Mvar αν και μόνο αν μπορεί να αναλυθεί ως G=XTX όπου Πρότυπο:Mvar είναι ένας πίνακας Πρότυπο:Math matrix.[8]. Επιπλέον, οι στήλες του Πρότυπο:Mvar δίνουν μια υλοποίηση στο Πρότυπο:Math. Επομένως, οποιαδήποτε μέθοδος αποσύνθεσης του Πρότυπο:Mvar επιτρέπει την εύρεση μιας υλοποίησης. Οι δύο κύριες προσεγγίσεις είναι παραλλαγές της αποσύνθεσης Τσολέσκι ή η χρήση φασματικών αναλύσεων για την εύρεση της κύριας τετραγωνικής ρίζας του Πρότυπο:Mvar, βλέπε Ορισμένος πίνακας#Ανάλυση[9].

Η πρόταση του θεωρήματος διακρίνει το πρώτο σημείο x1. Μια πιο συμμετρική παραλλαγή του ίδιου θεωρήματος είναι η ακόλουθη:

'Επακόλουθο [10]

Ένας συμμετρικός κοίλος Πρότυπο:Math πίνακας Πρότυπο:Mvar με πραγματικές καταχωρήσεις δέχεται μια υλοποίηση εάν και μόνο εάν οΠρότυπο:Mvar είναι αρνητικά ημιορισμένος στο υπερεπίπεδο H={v𝐑n:eTv=0}, that is

vTAv0 για κάθε v𝐑n έτσι ώστε i=1nvi=0.

Άλλοι χαρακτηρισμοί αφορούν τις ορίζουσες Κέιλι - Μένγκερ. Συγκεκριμένα, αυτές επιτρέπουν να δείξουμε ότι ένας συμμετρικός κοίλος πίνακας Πρότυπο:Math είναι υλοποιήσιμος στο Πρότυπο:Math αν και μόνο αν κάθε Πρότυπο:Math κύριος υποπίνακας είναι. Με άλλα λόγια, ένα ημιμετρικό σε πεπερασμένα πολλά σημεία είναι ενσωματώσιμο ισομετρικά στο Πρότυπο:Math αν και μόνο αν κάθε Πρότυπο:Math σημεία είναι[11].

Στην πράξη, οι συνθήκες οριστικότητας ή κατάταξης μπορεί να αποτύχουν λόγω αριθμητικών σφαλμάτων, θορύβου στις μετρήσεις ή λόγω του ότι τα δεδομένα δεν προέρχονται από πραγματικές ευκλείδειες αποστάσεις. Τα σημεία που υλοποιούν βέλτιστα παρόμοιες αποστάσεις μπορούν στη συνέχεια να βρεθούν με ημιοριστική προσέγγιση (και προσέγγιση χαμηλής τάξης, εάν είναι επιθυμητό) χρησιμοποιώντας εργαλεία γραμμικής άλγεβρας, όπως η ανάλυση σε ιδιάζουσες τιμές ή ο ημιοριστικός προγραμματισμός. Αυτό είναι γνωστό ως πολυδιάστατη κλιμάκωση. Παραλλαγές αυτών των μεθόδων μπορούν επίσης να αντιμετωπίσουν ελλιπή δεδομένα αποστάσεων.

Τα μη επισημειωμένα δεδομένα, δηλαδή ένα σύνολο ή ένα πολυσύνολο αποστάσεων που δεν αντιστοιχούν σε συγκεκριμένα ζεύγη, είναι πολύ πιο δύσκολο να αντιμετωπιστούν. Τέτοια δεδομένα προκύπτουν, παραδείγματος χάριν, στην αλληλούχιση DNA (συγκεκριμένα, ανάκτηση γονιδιώματος από μερική πέψη) ή στην ανάκτηση φάσεων. Δύο σύνολα σημείων ονομάζονται ομομετρικά εάν έχουν το ίδιο πολυσύνολο αποστάσεων (αλλά δεν συνδέονται απαραίτητα με άκαμπτο μετασχηματισμό). Η απόφαση για το αν ένα δεδομένο πολυσύνολο Πρότυπο:Math αποστάσεων μπορεί να πραγματοποιηθεί σε μια δεδομένη διάσταση Πρότυπο:Mvar είναι έντονα NP-δύσκολη[12]. Σε μία διάσταση αυτό είναι γνωστό ως το πρόβλημα της στροφής- είναι ένα ανοικτό ερώτημα αν μπορεί να επιλυθεί σε πολυωνυμικό χρόνο. Όταν το πολυσύνολο των αποστάσεων δίνεται με ράβδους σφάλματος, ακόμη και η περίπτωση της μίας διάστασης είναι NP-δύσκολη. Παρ' όλα αυτά, υπάρχουν πρακτικοί αλγόριθμοι για πολλές περιπτώσεις, π.χ. για τυχαία σημεία[13][14][15].

Μοναδικότητα των αναπαραστάσεων

Δεδομένου ενός πίνακα ευκλείδειας απόστασης, η ακολουθία των σημείων που τον υλοποιούν είναι μοναδική μέχρι άκαμπτων μετασχηματισμών - πρόκειται για ισομετρίες του ευκλείδειου χώρου: περιστροφές, ανακλάσεις, μεταφορές και οι συνθέσεις τους.[1]

Θεώρημα

Έστω x1,x2,,xn και y1,y2,,yn δύο ακολουθίες σημείων στον Πρότυπο:Mvar-διάστατο Ευκλείδειο χώρο Πρότυπο:Math.

Οι αποστάσεις

xixj 

and

yiyj 

είναι ίσες (για όλα τα Πρότυπο:Math) αν και μόνο αν υπάρχει ένας άκαμπτος μετασχηματισμός του Πρότυπο:Math που απεικονίζει το

xi

στο

yi

(για όλα τα Πρότυπο:Math).

Πρότυπο:Collapse top Οι άκαμπτοι μετασχηματισμοί διατηρούν τις αποστάσεις, οπότε η μία κατεύθυνση είναι σαφής. Ας υποθέσουμε ότι οι αποστάσεις xixj και yiyj είναι ίσες. Χωρίς απώλεια γενικότητας μπορούμε να υποθέσουμε ότι x1=y1=0 μετατοπίζοντας τα σημεία κατά x1 και y1, αντίστοιχα. Τότε ο Πρότυπο:Math πίνακας Γκραμ των υπόλοιπων διανυσμάτων xi=xix1 ταυτίζεται με τον πίνακα Γκραμ των διανυσμάτων yi (Πρότυπο:Math). Δηλαδή, XTX=YTY, όπου Πρότυπο:Mvar και Πρότυπο:Mvar είναι οι Πρότυπο:Math πίνακες που περιέχουν τα αντίστοιχα διανύσματα ως στήλες. Αυτό σημαίνει ότι υπάρχει ένας ορθογώνιος Πρότυπο:Math πίνακας Πρότυπο:Mvar έτσι ώστε Πρότυπο:Math, βλέπε Ορισμένος συμμετρικός πίνακας#Αδυναμία μέχρι μοναδιαίους μετασχηματισμούς. Ο Πρότυπο:Mvar περιγράφει έναν ορθογώνιο μετασχηματισμό του Πρότυπο:Math (μια σύνθεση περιστροφών και ανακλάσεων, χωρίς μετατοπίσεις) που απεικονίζει το xi to yi (και το0 στο 0). Ο τελικός άκαμπτος μετασχηματισμός περιγράφεται από τη σχέση T(x)=Q(xx1)+y1. Πρότυπο:Collapse bottom


Σε εφαρμογές, όταν οι αποστάσεις δεν ταιριάζουν ακριβώς, η ανάλυση Προκρούστη[16] αποσκοπεί στο να συσχετίσει δύο σύνολα σημείων όσο το δυνατόν πιο κοντά μέσω άκαμπτων μετασχηματισμών, συνήθως με τη χρήση της αποσύνθεσης μοναδιαίων τιμών. Η συνήθης ευκλείδεια περίπτωση είναι γνωστή ως το ορθογώνιο πρόβλημα Προκρούστη ή το πρόβλημα του Γουάμπα (όταν οι παρατηρήσεις σταθμίζονται για να ληφθούν υπόψη ποικίλες αβεβαιότητες). Παραδείγματα εφαρμογών περιλαμβάνουν τον προσδιορισμό του προσανατολισμού δορυφόρων, τη σύγκριση της δομής μορίων (στη χημειοπληροφορική), τη δομή πρωτεϊνών (δομική ευθυγράμμιση στη βιοπληροφορική) ή τη δομή οστών (στατιστική ανάλυση σχήματος στη βιολογία).

Δημοσιεύσεις

Δείτε επίσης

Εξωτερικοί σύνδεσμοι

Παραπομπές

Πρότυπο:Reflist

Πρότυπο:Authority control Πρότυπο:Portal bar