Παραγοντοποίηση πινάκων

Η παραγοντοποίηση πινάκων είναι μια κατηγορία αλγορίθμων συνεργατικού φιλτραρίσματος^[1] που χρησιμοποιούνται σε συστήματα συστάσεων. Οι αλγόριθμοι παραγοντοποίησης πινάκων αποσυνθέτουν τον πίνακα αλληλεπίδρασης χρήστη-στοιχείου σε ένα γινόμενο δύο ορθογώνιων πινάκων χαμηλότερης διάστασης^[2]. Αυτή η οικογένεια μεθόδων έγινε ευρέως γνωστή κατά τη διάρκεια του διαγωνισμού για το βραβείο Netflix^[3] λόγω της αποτελεσματικότητάς της, όπως ανέφερε ο Σάιμον Φανκ στην ανάρτησή του στο ιστολόγιό του το 2006^[4] , στην οποία μοιράστηκε τα ευρήματά του με την ερευνητική κοινότητα. Τα αποτελέσματα της πρόβλεψης μπορούν να βελτιωθούν με την ανάθεση διαφορετικών βαρών κανονικοποίησης σε λανθάνοντες παράγοντες με βάση τη δημοτικότητα των άρθρων και τη δραστηριότητα των χρηστών^[5].

Τεχνικές

Η ιδέα που κρύβεται πίσω από την παραγοντοποίηση πινάκων είναι η αναπαράσταση των χρηστών και των αντικειμένων σε ένα λανθάνων χώρο χαμηλότερης διάστασης. Από την αρχική εργασία του Φανκ το 2006 προτάθηκε ένα πλήθος προσεγγίσεων παραγοντοποίησης πινάκων για συστήματα συστάσεων. Ορισμένες από τις πιο χρησιμοποιούμενες και απλούστερες παρατίθενται στις ακόλουθες ενότητες.

Funk MF

Ο αρχικός αλγόριθμος που προτάθηκε από τον Σάιμον Φανκ στην ανάρτησή του στο ιστολόγιό του^[4] παραγοντοποίησε τον πίνακα αξιολόγησης χρήστη-στοιχείου ως το γινόμενο δύο πινάκων χαμηλότερης διάστασης, ο πρώτος έχει μια γραμμή για κάθε χρήστη, ενώ ο δεύτερος έχει μια στήλη για κάθε στοιχείο. Η γραμμή ή η στήλη που σχετίζεται με έναν συγκεκριμένο χρήστη ή αντικείμενο αναφέρεται ως λανθάνουσες παραμέτρους.^[6] Ας σημειωθεί ότι στο Funk MF δεν εφαρμόζεται αποσύνθεση μοναδιαίων τιμών, πρόκειται για ένα πρότυπο μηχανικής μάθησης τύπου SVD.^[4] Οι προβλεπόμενες βαθμολογίες μπορούν να υπολογιστούν ως $\tilde{R} = H W$ , όπου $\tilde{R} \in ℝ^{users \times items}$ είναι ο πίνακας βαθμολογίας χρήστη-αντικειμένου, $H \in ℝ^{users \times latent factors}$ περιέχει τους λανθάνοντες παράγοντες του χρήστη και $W \in ℝ^{latent factors \times items}$ τους λανθάνοντες παράγοντες του αντικειμένου.

Συγκεκριμένα, η προβλεπόμενη βαθμολογία που θα δώσει ο χρήστης u στο στοιχείο i υπολογίζεται ως εξής:

${\tilde{r}}_{u i} = \sum_{f = 0}^{n factors} H_{u, f} W_{f, i}$

Είναι δυνατή η προσαρμογή της εκφραστικής δύναμης του προτύπου αλλάζοντας τον αριθμό των λανθανόντων παραγόντων. Αποδείχθηκε^[7] ότι μια παραγοντοποίηση πίνακα με έναν μόνο λανθάνοντα παράγοντα είναι ισοδύναμη με μια σύσταση "πιο δημοφιλής" ή "κορυφαία δημοφιλής" (δηλαδή συνιστά τα στοιχεία με τις περισσότερες αλληλεπιδράσεις χωρίς καμία εξατομίκευση). Η αύξηση του αριθμού των λανθανόντων παραγόντων βελτιώνει την εξατομίκευση και, επομένως, την ποιότητα της σύστασης, έως ότου ο αριθμός των παραγόντων γίνει πολύ μεγάλος, οπότε το μοντέλο αρχίζει να υπερπροσαρμόζεται και η ποιότητα της σύστασης μειώνεται. Μια συνήθης στρατηγική για την αποφυγή της υπερπροσαρμογής είναι η προσθήκη όρων κανονικοποίησης στην αντικειμενική συνάρτηση^[8]^[9]. Το Funk MF αναπτύχθηκε ως πρόβλημα πρόβλεψης αξιολόγησης, οπότε χρησιμοποιεί ρητές αριθμητικές αξιολογήσεις ως αλληλεπιδράσεις μεταξύ του χρήστη και του χαρακτηριστικού.

Λαμβάνοντας υπόψιν όλα τα δεδομένα, το Funk MF ελαχιστοποιεί την ακόλουθη αντικειμενική συνάρτηση:

$\underset{H, W}{a r g m i n} ‖ R - \tilde{R} ‖_{F} + α ‖ H ‖ + β ‖ W ‖$

Όπου $‖ . ‖_{F}$ ορίζεται ως ο κανόνας του Φρομπένιους, ενώ οι άλλες νόρμες μπορεί να είναι είτε ο Φρομπένιους είτε κάποια άλλη νόρμα ανάλογα με το συγκεκριμένο πρόβλημα σύστασης.^[10]

SVD++

Ενώ το Funk MF είναι σε θέση να παρέχει πολύ καλή ποιότητα συστάσεων, η ικανότητά του να χρησιμοποιεί μόνο ρητές αριθμητικές αξιολογήσεις ως αλληλεπιδράσεις μεταξύ χρήστη και αντικειμένων δημιουργεί έναν περιορισμό. Τα σύγχρονα συστήματα συστάσεων θα πρέπει να αξιοποιούν όλες τις διαθέσιμες αλληλεπιδράσεις, τόσο τις ρητές (π.χ. αριθμητικές αξιολογήσεις) όσο και τις άρρητες (π.χ. συμπάθειες, αγορές, παραλείψεις, σελιδοδείκτες). Για το σκοπό αυτό, το SVD++ σχεδιάστηκε ώστε να λαμβάνει υπόψιν και τις σιωπηρές αλληλεπιδράσεις.^[11]^[12] Σε σύγκριση με το Funk MF, το SVD++ λαμβάνει επίσης υπόψιν την προκατάληψη των χρηστών και των αντικειμένων.

Η προβλεπόμενη βαθμολογία που θα δώσει ο χρήστης u στο στοιχείο i υπολογίζεται ως εξής:

${\tilde{r}}_{u i} = μ + b_{i} + b_{u} + \sum_{f = 0}^{n factors} H_{u, f} W_{f, i}$

Όπου $μ$ αναφέρεται στη συνολική μέση βαθμολογία για όλα τα στοιχεία και $b_{i}$ και $b_{u}$ αναφέρεται στην παρατηρούμενη απόκλιση του στοιχείου $i$ και του χρήστη $u$ αντίστοιχα από το μέσο επίπεδο^[13]. Η SVD++ έχει ωστόσο ορισμένα ελαττώματα, με κύριο μειονέκτημα ότι η μέθοδος αυτή δεν βασίζεται σε πρότυπα. Αυτό σημαίνει ότι εάν προστεθεί ένας νέος χρήστης, ο αλγόριθμος δεν είναι σε θέση να τον μοντελοποιήσει, εκτός εάν επανεκπαιδευτεί ολόκληρο το πρότυπο. Παρόλο που το σύστημα μπορεί να έχει συγκεντρώσει κάποιες αλληλεπιδράσεις για τον εν λόγω νέο χρήστη, οι λανθάνουσες παραμέτρους του δεν είναι διαθέσιμες και επομένως δεν μπορούν να γίνουν υπολογισμοί συστάσεων. Αυτό είναι ένα παράδειγμα προβλήματος ψυχρής εκκίνησης, δηλαδή ο εισηγητής δεν μπορεί να αντιμετωπίσει αποτελεσματικά νέους χρήστες ή στοιχεία και θα πρέπει να εφαρμοστούν ειδικές στρατηγικές για να αντιμετωπιστεί αυτό το μειονέκτημα^[14].

Ένας πιθανός τρόπος για να αντιμετωπιστεί αυτό το πρόβλημα της ψυχρής εκκίνησης είναι να τροποποιηθεί ο SVD++ ώστε να γίνει ένας αλγόριθμος "βασισμένος στο πρότυπο", επιτρέποντας έτσι την εύκολη διαχείριση νέων στοιχείων και νέων χρηστών.

Όπως αναφέρθηκε προηγουμένως στο SVD++ δεν έχουμε τους λανθάνοντες παράγοντες των νέων χρηστών, επομένως είναι απαραίτητο να τους απεικονίσουμε με διαφορετικό τρόπο. Οι λανθάνοντες παράγοντες του χρήστη αντιπροσωπεύουν την προτίμηση του εν λόγω χρήστη για τους λανθάνοντες παράγοντες του αντίστοιχου στοιχείου, επομένως οι λανθάνοντες παράγοντες του χρήστη μπορούν να εκτιμηθούν μέσω των προηγούμενων αλληλεπιδράσεων των χρηστών. Εάν το σύστημα είναι σε θέση να συγκεντρώσει κάποιες αλληλεπιδράσεις για τον νέο χρήστη, είναι δυνατόν να εκτιμηθούν οι λανθάνουσες παράμετροι του. Σημειώστε ότι αυτό δεν επιλύει πλήρως το πρόβλημα της ψυχρής εκκίνησης, αφού η σύσταση εξακολουθεί να απαιτεί κάποιες αξιόπιστες αλληλεπιδράσεις για τους νέους χρήστες, αλλά τουλάχιστον δεν υπάρχει ανάγκη να υπολογίζεται εκ νέου ολόκληρο το μοντέλο κάθε φορά. Έχει αποδειχθεί ότι αυτή η διατύπωση είναι σχεδόν ισοδύναμη με ένα πρότυπο SLIM,^[15] η οποία είναι μια σύσταση βασισμένη στο μοντέλο αντικείμενο-στοιχείο.

${\tilde{r}}_{u i} = μ + b_{i} + b_{u} + \sum_{f = 0}^{n factors} (\sum_{j = 0}^{n items} r_{u j} W_{j, f}^{T}) W_{f, i}$

Με αυτή τη διατύπωση, η ισοδύναμη σύσταση αντικειμένου-αντικειμένου θα ήταν $\tilde{R} = R S = R W^{T} W$ . Επομένως, ο πίνακας ομοιότητας είναι συμμετρικός.

SVD για κάθε ομάδα

Η SVD για συγκεκριμένες ομάδες μπορεί να είναι μια αποτελεσματική προσέγγιση για το πρόβλημα της ψυχρής εκκίνησης σε πολλά σενάρια ^[8]. Στη συνέχεια, μόλις φτάσει ένας νέος χρήστης ή στοιχείο, μπορούμε να του αναθέσουμε μια ετικέτα ομάδας και να προσεγγίσουμε τον λανθάνοντα παράγοντα του με τις ομαδικές επιδράσεις (της αντίστοιχης ομάδας). Κατά συνέπεια, παρόλο που οι αξιολογήσεις που σχετίζονται με τον νέο χρήστη ή στοιχείο δεν είναι απαραίτητα διαθέσιμες, οι επιδράσεις της ομάδας παρέχουν άμεσες και αποτελεσματικές προβλέψεις.

Η προβλεπόμενη βαθμολογία που θα δώσει ο χρήστης u στο στοιχείο i υπολογίζεται ως εξής:

${\tilde{r}}_{u i} = \sum_{f = 0}^{n factors} (H_{u, f} + S_{v_{u}, f}) (W_{f, i} + T_{f, j_{i}})$

Εδώ $v_{u}$ και $j_{i}$ συμβολίζουν την ετικέτα ομάδας του χρήστη u και του αντικειμένου i, αντίστοιχα, οι οποίες είναι ίδιες για τα μέλη της ίδιας ομάδας. Και τα $S$ και $T$ είναι πίνακες των επιδράσεων της ομάδας. Για παράδειγμα, για έναν νέο χρήστη $u_{n e w}$ του οποίου ο λανθάνων παράγοντας $H_{u_{n e w}}$ δεν είναι διαθέσιμος, μπορούμε τουλάχιστον να προσδιορίσουμε την ετικέτα της ομάδας του $v_{u_{n e w}}$ , και να προβλέψουμε τις αξιολογήσεις του ως εξής:

${\tilde{r}}_{u_{n e w} i} = \sum_{f = 0}^{n factors} S_{v_{u_{n e w}}, f} (W_{f, i} + T_{f, j_{i}})$

Με τον τρόπο αυτό επιτυγχάνεται μια καλή προσέγγιση των μη παρατηρούμενων αξιολογήσεων.

Υβριδικό MF

Τα τελευταία χρόνια αναπτύχθηκαν πολλά άλλα πρότυπα παραγοντοποίησης πινάκων για την αξιοποίηση του συνεχώς αυξανόμενου όγκου και της ποικιλίας των διαθέσιμων δεδομένων αλληλεπίδρασης και των περιπτώσεων χρήσης. Οι υβριδικοί αλγόριθμοι παραγοντοποίησης πινάκων είναι ικανοί να συγχωνεύουν ρητές και σιωπηρές αλληλεπιδράσεις^[16] ή τόσο δεδομένα περιεχομένου όσο και δεδομένα συνεργασίας^[17]^[18]^[19].

Βαθιά μάθηση MF

Τα τελευταία χρόνια προτάθηκαν διάφορες τεχνικές νευρωνικής και βαθιάς μάθησης, ορισμένες από τις οποίες γενικεύουν τους παραδοσιακούς αλγορίθμους παραγοντοποίησης πινάκων μέσω μιας μη γραμμικής νευρωνικής αρχιτεκτονικής ^[20]. Αν και η βαθιά μάθηση εφαρμόστηκε σε πολλά διαφορετικά σενάρια: επίγνωση του πλαισίου, επίγνωση της ακολουθίας, κοινωνική σήμανση κ.λπ., η πραγματική αποτελεσματικότητά της όταν χρησιμοποιείται σε ένα απλό σενάριο συνεργατικού φιλτραρίσματος αμφισβητήθηκε. Η συστηματική ανάλυση των δημοσιεύσεων που εφαρμόζουν βαθιά μάθηση ή νευρωνικές μεθόδους στο πρόβλημα των top-k συστάσεων, οι οποίες δημοσιεύονται στα καλύτερα συνέδρια (SIGIR, KDD, WWW, RecSys, IJCAI), έδειξε ότι κατά μέσο όρο λιγότερο από το 40% των άρθρων είναι αναπαραγώγιμα, με ποσοστό που φτάνει το 14% σε ορισμένα συνέδρια. Συνολικά, οι μελέτες εντοπίζουν 26 άρθρα, από τα οποία μόνο τα 12 μπορούν να αναπαραχθούν και τα 11 μπορούν να ξεπεραστούν από πολύ παλαιότερες, απλούστερες, σωστά καθορισμένες βασικές γραμμές. Οι εργασίες επισημαίνουν επίσης ορισμένα πιθανά προβλήματα στην τρέχουσα έρευνα και ζητούν τη βελτίωση της επιστημονικής πρακτικής στον τομέα αυτό.^[21]^[22]. Παρόμοια προβλήματα έχουν επίσης εντοπιστεί σε συστήματα συστάσεων με επίγνωση της ακολουθίας^[23].

Βιβλιογραφία

Δείτε επίσης

Παραπομπές

Πρότυπο:Reflist

Πρότυπο:Authority control Πρότυπο:Γραμμική Άλγεβρα Πρότυπο:Portal bar

[1] Πρότυπο:Cite web

[Koren09-2] Πρότυπο:Cite journal

[3] Πρότυπο:Cite web

[Funkblog-4] 4,0 ^4,1 ^4,2 Πρότυπο:Cite web

[5] Πρότυπο:Cite journal

[Agarwal09-6] Πρότυπο:Cite book

[Jannach13-7] Πρότυπο:Cite book

[bi2017-8] 8,0 ^8,1 Πρότυπο:Cite journal

[9] Πρότυπο:Cite journal

[Paterek07-10] Πρότυπο:Cite journal

[Cao15-11] Πρότυπο:Cite book

[Jia14-12] Πρότυπο:Cite book

[13] Πρότυπο:Cite journal

[Kluver14-14] Πρότυπο:Cite book

[Zheng14-15] Πρότυπο:Cite book

[Zhao16-16] Πρότυπο:Cite journal

[Zhou12-17] Πρότυπο:Cite book

[Adams10-18] Πρότυπο:Cite arXiv

[Fang11-19] Πρότυπο:Cite book

[20] Πρότυπο:Cite book

[21] Πρότυπο:Cite book

[22] Πρότυπο:Cite journal

[23] Πρότυπο:Cite book

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

Παραγοντοποίηση πινάκων

Περιεχόμενα

Τεχνικές

Funk MF

SVD++

SVD για κάθε ομάδα

Υβριδικό MF

Βαθιά μάθηση MF

Βιβλιογραφία

Δείτε επίσης

Παραπομπές

Μενού πλοήγησης

Παραγοντοποίηση πινάκων

Τεχνικές

Funk MF

SVD++

SVD για κάθε ομάδα

Υβριδικό MF

Βαθιά μάθηση MF

Βιβλιογραφία

Δείτε επίσης

Παραπομπές

Μενού πλοήγησης

Αναζήτηση