Αλγόριθμος ταξινόμησης

Από testwiki
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση
Αναπαράσταση ταξινόμησης πίνακα με τυχαίες τιμές με χρήση του αλγορίθμου γρήγορης ταξινόμησης (Quicksort)

Στην επιστήμη των υπολογιστών ο αλγόριθμος ταξινόμησης είναι ένας αλγόριθμος που μεταθέτει τα στοιχεία μίας ακολουθίας έτσι ώστε να έχουν μία συγκεκριμένη σειρά. Παραδείγματα τέτοιων σειρών αποτελούν η αριθμητική και η αλφαβητική.

Πιο συγκεκριμένα ένας αλγόριθμος ταξινόμησης είναι ένας αλγόριθμος που δοσμένης μίας ακολουθίας εισόδου (a1,a2,..,an) και μίας συνάρτησης δίαταξης f, παράγει μία ακολουθία εξόδου (a'1,a'2,..,a'n) τέτοια ώστε [1]:

  1. f(a'1)f(a'2)...f(a'n)
  2. Η ακολουθία (a'n) αποτελεί μετάθεση της (an)

Η συνάρτηση f είναι αυτή που καθορίζει τη σειρά ταξινόμησης. Έτσι επιλέγοντας f(x)=x η σειρά ταξινόμησης είναι η φθίνουσα.

Βασικές έννοιες

  • Εσωτερική (internal) λέγεται η ταξινόμηση η οποία γίνεται εξ ολοκλήρου στην κύρια μνήμη.
  • Εξωτερική (external) λέγεται η ταξινόμηση που γίνεται στη δευτερεύουσα μνήμη όπως για παράδειγμα στον σκληρό δίσκο.
  • Αντιστροφή (inversion): Έστω μία ακολουθία (a1,a2,...,an). Αν i<j και ai>aj, τότε λέμε ότι το ζεύγος (ai,aj) είναι μία αντιστροφή. Για παράδειγμα η ακολουθία (3,1,4,2) έχει τρεις αντιστροφές, τις (3,1), (3,2), (4,2).[2]
  • Ευστάθεια (stability): Ένας αλγόριθμος ταξινόμησης λέγεται ότι είναι ευσταθής (stable), αν τα στοιχεία με ίσες τιμές διατηρούν τη σειρά που είχαν στην αρχική ακολουθία. Φυσικά έχει νόημα να μιλάμε για ευστάθεια μόνο όταν τα στοιχεία φέρουν επιπλέον πληροφορία που δε λαμβάνει μέρος στην ταξινόμηση όπως για παράδειγμα όταν ταξινομούνται ζεύγη της μορφής (κλειδί , δεδομένα) και η ταξινόμηση γίνεται με βάση το κλειδί.
  • Προσαρμοστικότητα (adaptability): Προσαρμοστικός (adaptive) είναι ένας αλγόριθμος ταξινόμησης όταν ταξινομεί πιο γρήγορα δεδομένα τα οποία είναι μερικώς ταξινομημένα απ' ό,τι όταν αυτά έχουν τυχαία σειρά.[3] Παράδειγμα ενός προσαρμοστικού αλγορίθμου είναι η ταξινόμηση με εισαγωγή, ενώ ενός μη προσαρμοστικού η ταξινόμηση με συγχώνευση.
  • Επιτόπου (in-place) εκτέλεση: Στην πιο αυστηρή του μορφή, ένας αλγόριθμος εκτελείται επιτόπου όταν χρησιμοποιεί σταθερό μέγεθος επιπλέον μνήμης, δηλαδή ανήκει στην κλάση DSPACE(1). Κάτι τέτοιο όμως είναι αρκετά δεσμευτικό καθώς η κλάση DSPACE(1) ισοδυναμεί με τις κανονικές γλώσσες[4] και επίσης θεωρητικά για να αποθηκευτεί σε μία μεταβλητή το μέγεθος ενός πίνακα, απαιτείται Ω(logn) μνήμη. Γι' αυτό το λόγο θεωρούμε ότι οι μεταβλητές έχουν σταθερό μέγεθος και ότι ένας αλγόριθμος μπορεί να χρησιμοποιεί O(logn) μνήμη, έτσι ώστε να συμπεριλαμβάνονται αλγόριθμοι όπως η γρήγορη ταξινόμηση στους αλγορίθμους που εκτελούνται επιτόπου.

Κάτω φράγμα ταξινόμησης

Για όλους τους αλγόριθμους που βασίζονται σε συγκρίσεις υπάρχει ένα κάτω φράγμα για το χρόνο εκτέλεσης στη χειρότερη περίπτωση. Συγκεκριμένα για κάθε συγκριτικό αλγόριθμο που δεν χρησιμοποιεί τυχαιότητα υπάρχει ένα στιγμιότυπο εισόδου για το οποίο ο αλγόριθμος εκτελεί Ω(nlogn) συγκρίσεις.[5]

Απόδειξη

Έστω S το σύνολο όλων των πιθανών εισόδων. Αρχικά το |S| ισούται με όλες τις δυνατές μεταθέσεις της εισόδου, δηλαδή n! . Μπορούμε να σκεφτούμε μία σύγκριση ως μία διαδικασία που σπάει το S σε δύο σύνολα, σε αυτό που η απάντηση στη σύγκριση είναι ΝΑΙ και σε αυτό που η απάντηση είναι ΌΧΙ. Τότε κάθε σύγκριση σπάσει το S σε δύο υποσύνολα με το μεγαλύτερο να έχει μέγεθος τουλάχιστον |S|/2. Αφού αρχικά το S έχει μέγεθος n! και επειδή ο αλγόριθμος,για να γνωρίζει την απάντηση, πρέπει να μειώσει το |S| σε 1, οφήλει να εκτελέσει τουλάχιστον log2(n!) συγκρίσεις. Όμως τότε: log2(n!)=log2(n*(n1)*..*2*1)=log2(n)+log2(n1)+..+log2(1)n2log2(n2)=Ω(nlogn)

Κατάλογος συγκριτικών αλγόριθμων ταξινόμησης

Συγκριτικοί αλγόριθμοι ταξινόμησης
Αλγόριθμος Καλύτερη περίπτωση Μέση περίπτωση Χειρότερη περίπτωση Μνήμη Ευσταθής Μέθοδος Σημειώσεις
Γρήγορη ταξινόμηση
(Quicksort)
Πρότυπο:Sort,
παραλλαγή του σε Πρότυπο:Sort
Πρότυπο:Sort Πρότυπο:Sort Στη μέση περίπτωση Πρότυπο:Sort Συνήθως όταν εκτελείται επιτόπου δεν είναι ευσταθής, αν και υπάρχουν ευσταθείς υλοποιήσεις. Διαμέριση Η γρήγορη ταξινόμηση γίνεται συνήθως επιτόπου με μέγεθος στοίβας Πρότυπο:Nowrap.[6][7]
Ταξινόμηση με συγχώνευση
(Merge sort)
Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort
Δες από κάτω για έναν υβριδικό με O(1) μνήμη.
Ναι Συγχώνευση Αρκετά παραλληλοποιήσιμος (έως και Πρότυπο:Nowrap χρησιμοποιώντας τον αλγόριθμο των τριών Ούγγρων[8] ή, πιο πρακτικά, με τον παράλληλο αλγόριθμο ταξινόμησης του Cole) για την επεξεργασία μεγάλου πλήθους δεδομένων.
Ταξινόμηση με
επιτόπου συγχώνευση

(In-place merge sort)
Πρότυπο:Sort
Δες από κάτω για έναν υβριδικό που τρέχει σε Πρότυπο:Sort
Πρότυπο:Sort Ναι Συγχώνευση Μπορεί να είναι ευσταθής με χρήση ευσταθούς επιτόπου συγχώνευσης.[9]
Block sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή & Συγχώνευση Κάνει επιτόπου συγχώνευση με κομμάτια (blocks) σε O(n) [10] και υλοποιείται από κάτω προς τα πάνω.
Tαξινόμηση με σωρό
(Heapsort)
Πρότυπο:Sort
Αν όλα τα στοιχεία είναι διακριτά, Πρότυπο:Sort
Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Επιλογή
Ταξινόμηση φυσαλίδας
(Bubble sort)
Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Ανταλλαγή Απλός στην υλοποίηση.
Ταξινόμηση με επιλογή
(Selection sort)
Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Επιλογή Ευσταθής όταν χρησιμοποιείται O(n) επιπλέον μνήμη ή όταν χρησιμοποιούνται συνδεδεμένες λίστες.
Ταξινόμηση με εισαγωγή
(Insertion sort)
Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή Πρότυπο:Nowrap για ακολουθίες με d αντιστροφές (δηλαδή ζεύγη στοιχείων που είναι αντίστροφα ταξινομημένα).
Shell sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Εισαγωγή Απλός στην υλοποίηση, δεν χρησιμοποιεί αναδρομή, σχετικά γρήγορος και χρησιμοποιείται όταν δεν υπάρχει αρκετή διαθέσιμη μνήμη,για παράδειγμα στα ενσωματωμένα συστήματα. Υπάρχει ακολουθία διαστημάτων με χειρότερη περίπτωση O(n (log n)²), αλλά τότε η καλύτερη περίπτωση υπερβαίνει το O(n log n).
Introsort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Διαμέριση & Επιλογή Χρησιμοποιεί quicksort και κάνει εναλλαγή σε ταξινόμηση με σωρό όταν το βάθος της αναδρομής γίνει μεγάλο. Χρησιμοποιείται σε πολλές υλοποιήσεις της STL.
Timsort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή & Διαμέριση Βασίζεται στην ταξινόμηση με συγχώνευση και στην ταξινόμηση με εισαγωγή και λαμβάνει υπόψη ήδη ταξινομημένες υποακολουθίες. Χρησιμοποιείται από την Python, Java, το Android και το GNU Octave.
Cubesort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή Κάνει n συγκρίσεις όταν τα δεδομένα είναι ήδη ή αντιστρόφως ταξινομημένα.
Binary tree sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή
Cycle sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Εισαγωγή Εκτελείται επιτόπου με θεωρητικά βέλτιστο αριθμό εγγραφών.
Library sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Εισαγωγή
Patience sorting Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Εισαγωγή & Επιλογή Βρίσκει όλες τις μέγιστες αυξανόμενες υποακολουθίες σε Πρότυπο:Nowrap.
Smoothsort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Επιλογή Προσαρμοστικός, παραλλαγή της ταξινόμησης με σωρό που βασίζεται στην ακολουθία Leonardo αντί του δυαδικού σωρού.
Tournament sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Επιλογή Παραλλαγή της ταξινόμησης με σωρό.
Cocktail sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Ανταλλαγή Παραλλαγή της ταξινόμησης φυσαλίδας η οποία κάνει περάσματα και από τις δύο κατευθύνσεις.
Comb sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Όχι Ανταλλαγή Παραλλαγή της ταξινόμησης φυσαλίδας η οποία είναι γρηγορότερη στην πράξη.
Gnome sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Πρότυπο:Sort Ναι Ανταλλαγή Παρόμοιος με την ταξινόμηση με εισαγωγή. Δεν περιέχει φωλιασμένες επαναλήψεις.

Δείτε επίσης

Παραπομπές

Εξωτερικοί σύνδεσμοι