Περίληψη |
Οι τεχνολογικές εξελίξεις στα δίκτυα υπολογιστών, τις κινητές υπολογιστικές συσκευές, και τα συστήματα, έχουν προκαλέσει μία δραματική αύξηση στις υπηρεσίες παροχής περιεχομένου. Αυτή η τεράστια διαθεσιμότητα περιεχομένου πολυμέσων και οι αυστηροί χρονικοί περιορισμοί κατά την αναζήτηση του κατάλληλου περιεχομένου, επιβάλλουν την εκπλήρωση διάφορων προϋποθέσεων για τη διατήρηση της αλληλεπίδρασης του χρήστη με την υπηρεσία. Τα συστήματα συστάσεων αντιμετωπίζουν αυτό το πρόβλημα συστήνοντας το κατάλληλο εξατομικευμένο περιεχόμενο στους χρήστες, αξιοποιώντας πληροφορίες σχετικά με τις προτιμήσεις τους. Μία πληθώρα αλγορίθμων συστάσεων έχει παρουσιαστεί. Ωστόσο, η επιλογή του καλύτερου αλγορίθμου συστάσεων στο πλαίσιο μίας συγκεκριμένης υπηρεσίας ενέχει αρκετές προκλήσεις. Ανάλογα με τα δεδομένα που παρέχονται, η απόδοση των αλγορίθμων συστάσεων ποικίλλει. Για την αντιμετώπιση αυτού του ζητήματος, υβριδικά συστήματα συστάσεων έχουν προταθεί, με στόχο τη βελτίωση της ακρίβειας της πρόβλεψης των προτιμήσεων, συνδυάζοντας αποτελεσματικά πολλούς αλγορίθμους συστάσεων.
Έχουμε αναπτύξει τον εnαbler , ένα υβριδικό σύστημα συστάσεων που χρησιμοποιεί διάφορους αλγορίθμους μηχανικής μάθησης για την εκμάθηση ενός αποτελεσματικού συνδυασμού μιας πλειάδας ποικιλόμορφων αλγορίθμων συστάσεων, και επιλέγει τον καλύτερο συνδυασμό τους για τα δεδομένα που δίνονται. Πιο συγκεκριμένα, αποτελείται από τρία βασικά επίπεδα: τον εκπαιδευτή (trainer) που εκπαιδεύει τους ενσωματωμένους αλγορίθμους συστάσεων, τον συνδυαστή (blender) που προσδιορίζει τον πιο αποτελεσματικό συνδυασμό, και τον δοκιμαστή (tester) για την αξιολόγηση της απόδοσης του συστήματος. Ο εnαbler ενσωματώνει μια ποικιλία από αλγορίθμους συστάσεων, που εκτείνονται από αλγορίθμους συνεργατικού φιλτραρίσματος (collaborative filtering) και αλγορίθμους βασιζόμενους στο περιεχόμενο (content-based), σε πρόσφατα ανεπτυγμένους αλγορίθμους που χρησιμοποιούν τεχνητά νευρωνικά δίκτυα. Ο εnαbler χρησιμοποιεί το εμφωλευμένο πρωτόκολλο διασταυρωμένης επικύρωσης (nested cross-validation ) για την αυτόματη επιλογή του καλύτερου αλγορίθμου μηχανικής μάθησης και των αντίστοιχων καλύτερων τιμών των υπέρ-παραμέτρων του για τα δεδομένα εισόδου, παρέχοντας μια συντηρητική εκτίμηση της απόδοσης του τελικού μοντέλου συνδυασμού. Επιπλέον, είναι αρθρωτός, έτσι, μπορεί εύκολα να επεκταθεί ώστε να περιλαμβάνει και άλλους αλγορίθμους.
Ο εnαbler έχει αξιολογηθεί εκτενώς στο πλαίσιο των υπηρεσιών βίντεο συνεχούς ροής. Σημειώνει καλύτερη απόδοση από πολλούς άλλους αλγορίθμους συστάσεων, όταν εξετάζεται στο σύνολο δεδομένων "Movielens 1M", που χρησιμοποιείται ευρέως για αξιολόγηση της απόδοσης αλγορίθμων συστάσεων. Για παράδειγμα, στα πλαίσια της μετρικής RMSE για την αξιολόγηση της ακρίβειας, ο εnαbler επιτυγχάνει την τιμή 0.8206, σε σύγκριση με τις κορυφαίες αποδόσεις των αλγορίθμων AutoRec και SVD, με τιμές 0.827 και 0.845, αντιστοίχως. Ένα πιλοτικό σύστημα συστάσεων αναπτύχθηκε και δοκιμάστηκε στο περιβάλλον παραγωγής ενός μεγάλου τηλεπικοινωνιακού φορέα στην Ελλάδα, ο οποίος παρέχει υπηρεσίες βίντεο συνεχούς ροής. Εθελοντές πελάτες της υπηρεσίας χρησιμοποίησαν το σύστημα στο πλαίσιο μίας μελέτης πεδίου. Τα αποτελέσματα της μελέτης ήταν ενθαρρυντικά ως προς την χρησιμότητα και την αποτελεσματικότητα του συστήματος. Επιπλέον, μία μετέπειτα αξιολόγηση του εnαbler , χρησιμοποιώντας τις βαθμολογίες χρηστών που συλλέχθηκαν κατά τη διάρκεια της μελέτης πεδίου, έδειξε ότι εnαbler σημειώνει σημαντικά καλύτερη απόδοση από πολλούς δημοφιλείς αλγορίθμους συστάσεων, όπως ο SVD, εμφανίζοντας βελτίωση στα πλαίσια της RMSE μετρικής μεγαλύτερη του 16%.
|