Your browser does not support JavaScript!

Αρχική    Do we need sophisticated imputation in AutoML?  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000460153
Τίτλος Do we need sophisticated imputation in AutoML?
Άλλος τίτλος Χρειαζόμαστε σύνθετη συμπλήρωση ελλειπουσών τιμών στην Αυτοματοποιημένη Μηχανική Μάθηση;
Συγγραφέας Πατεράκης, Γιώργος Μ.
Σύμβουλος διατριβής Τσαμαρδινός, Ιωάννης
Μέλος κριτικής επιτροπής Χριστοφίδης, Βασίλης
Τριανταφύλλου, Σοφία
Περίληψη Πολλά δεδομένα πραγματικού κόσμου περιέχουν ελλείπουσες τιμές, ενώ αντίθετα, οι περισσότεροι αλγόριθμοι Μηχανικής Μάθησης προϋποθέτουν πλήρη σύνολα δεδομένων. Για το λόγο αυτό, έχουν προταθεί αρκετοί αλγόριθμοι για την πρόβλεψη και τη συμπλήρωση των ελλειπουσών τιμών. Λαμβάνοντας υπόψη τις προόδους στους αλγόριθμους προγνωστικής μοντελοποίησης στο πλαίσιο της Αυτοματοποιημένης Μηχανικής Μάθησης, ένα ερώτημα που ανακύπτει φυσικά είναι σε ποιο βαθμό οι περίπλοκοι αλγόριθμοι συμπλήρωσης ελλειπουσών τιμών (π.χ. βασισμένοι σε νευρωνικά δίκτυα) είναι πραγματικά απαραίτητοι ή μπορούμε να λάβουμε μια ικανοποιητική απόδοση χρησιμοποιώντας απλές μεθόδους όπως η συμπλήρωση με τη μέση τιμή. Σε αυτή την εργασία, συγκρίνουμε πειραματικά 6 εκπροσώπους από διαφορετικές αλγοριθμικές οικογένειες συμπλήρωσης ελλειπουσών τιμών από την οπτική της αυτοματοποιημένης μηχανικής μάθησης, συμπεριλαμβανομένων, ένα βήμα επιλογής χαρακτηριστικών και συνδυασμένη επιλογή αλγόριθμου και υπερπαραμέτρων. Τα πειράματα διεξήχθησαν σε 25 ελλιπή σύνολα δεδομένων πραγματικού κόσμου και 10 πλήρη σύνολα δεδομένων στα οποία εισάγονται ελλιπείς τιμές σύμφωνα με διαφορετικούς μηχανισμούς έλλειψης, σε διαφορετικές συχνότητες. Το κύριο συμπέρασμα που προκύπτει από τα πειράματά μας είναι ότι η καλύτερη μέθοδος κατά μέσο όρο είναι ο αποθορυβοποίητης αυτόματος κωδικοποιητής σε σύνολα δεδομένων πραγματικού κόσμου και η επαναληπτική συμπλήρωση βασισμένη σε παλινδρόμηση τυχαίων δασών σε σύνολα δεδομένων με εισαγμένες ελλιπείς τιμές, ακολουθούμενα από τη συμπλήρωση μέσης τιμής. Επιπλέον, ο δυαδικός δείκτης, δηλαδή οι μεταβλητές που κωδικοποιούν την έλλειψη δεδομένων, βελτιώνουν πραγματικά την προγνωστική απόδοση, κατά μέσο όρο. Τελευταίο αλλά εξίσου σημαντικό, αν και υπάρχουν περιπτώσεις όπου τα νευρωνικά συστήματα συμπλήρωσης ελλειπουσών τιμών βελτιώνουν σημαντικά την προγνωστική απόδοση, αυτό συμβαίνει με μεγάλο υπολογιστικό κόστος και απαιτεί τη μέτρηση όλων των τιμών χαρακτηριστικών για την συμπλήρωση νέων δειγμάτων.
Φυσική περιγραφή xiv, 94 σ. : σχεδ., πιν., εικ. (μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Machine learning
Missing data
Ελλειπούσες τιμές
Μηχανική μάθηση
Ημερομηνία έκδοσης 2023-12-01
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 1038

Ψηφιακά τεκμήρια
No preview available

Δεν έχετε δικαιώματα για να δείτε το έγγραφο.
Δεν θα είναι διαθέσιμο έως: 2026-12-01