Your browser does not support JavaScript!

Αρχική    Single shot 3D hand pose estimation using radial basis function networks trained on synthetic data  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000414839
Τίτλος Single shot 3D hand pose estimation using radial basis function networks trained on synthetic data
Άλλος τίτλος Εκτίμηση της 3Δ πόζας του ανθρώπινου χεριού από μια εικόνα χρησιμοποιώντας δίκτυα συναρτήσεων ακτινικής βάσης εκπαιδευμένα σε συνθετικά δεδομένα
Συγγραφέας Νικοδήμου, Βασίλειος - Κλείτος Β.
Σύμβουλος διατριβής Αργυρός, Αντώνης
Μέλος κριτικής επιτροπής Στεφανίδης, Κωνσταντίνος
Ζαμπούλης, Ξενοφών
Περίληψη Η παρακολούθηση και ανάλυση της ανθρώπινης κίνησης αποτελεί μια σημαντική κατηγορία προβλημάτων στον τομέα της Υπολογιστικής Όρασης. Μέσα σε αυτή την κατηγορία, τα προβλήματα που αφορούν στην εκτίμηση της 3Δ πόζας ενός ανθρώπινου χεριού είναι ιδιαίτερα ενδιαφέροντα. Αυτή η εργασία στοχεύει στην επίλυση του προβλήματος της εκτίμησης της πόζας ενός ανθρώπινου χεριού σε πραγματικό χρόνο, χρησιμοποιώντας μόνο οπτική πληροφορία. Πολλές προσεγγίσεις έχουν προταθεί για την επίλυση αυτού του προβλήματος, μεταξύ των οποίων και η εφαρμογή τεχνικών μηχανικής μάθησης. Η πρόσφατη επιτυχία των βαθέων νευρωνικών δικτύων σε προβλήματα υπολογιστικής όρασης έχει οδηγήσει σε σημαντική πρόοδο σε αυτόν τον τομέα. Ωστόσο, παρά τις έντονες προσπάθειες που έχουν αφιερωθεί στην επίλυση προβλημάτων αυτής της κατηγορίας, καμία μέθοδος δεν έχει καταφέρει να επιλύσει το πρόβλημα στη γενική του μορφή. Οι τεχνικές μηχανικής μάθησης και ιδιαίτερα αυτές που βασίζονται σε βαθιά νευρωνικά δίκτυα απαιτούν μεγάλα επισημασμένα σύνολα δεδομένων γι α τη εκπαίδευσή τους. Η επισήμανση σε πραγματικά δεδομένα είναι κοπιαστική και απαιτεί χρόνο και άλλους ανθρώπινους πόρους. Επομένως, προτιμάται ένας αυτόματος τρόπος δημιουργίας και επισημείωσης των δεδομένων εκπαίδευσης. Η χρήση συνθετικών δεδομένων παρέχει έναν εύκολο τρόπο για τη δημιουργία μεγάλου όγκου επισημασμένων δεδομένων υψηλής ακρίβειας. Ένα μειονέκτημα αυτής της προσέγγισης είναι ότι οι λεπτομέρειες των πραγματικών δεδομένων μπορεί να μην προσομοιωθούν με ικανοποιητική ακρίβεια κατά τη δημιουργία των συνθετικών δεδομένων. Οι υπάρχουσες τεχνικές μηχανικής μάθησης είναι ευαίσθητες στην κατανομή των δεδομένων εισόδου και συνεπώς, μπορεί να αποτύχουν να γενικεύσουν σε πραγματικά δεδομένα όταν εκπαιδεύονται σε συνθετικά δεδομένα. Σε αυτή την εργασία παρουσιάζουμε μια νέα προσέγγιση για την εκτίμηση πόζας χεριού από δεδομένα βάθους από μία μόνο όψη. Πιο συγκεκριμένα, υποθέτουμε ότι η είσοδος είναι ένα μεμονωμένο καρέ δεδομένων βάθους, που απεικονίζει ένα απομονωμένο χέρι, δηλαδή ένα χέρι που δεν επικαλύπτεται από αντικείμενα στο περιβάλλον του. Το καρέ βάθους προσλαμβάνεται από έναν αισθητήρα βάθους και δεν χρησιμοποιούνται οπτικά βοηθήματα για να διευκολυνθεί η εργασία εντοπισμού του χεριού ή τμημάτων του. Η μέθοδος ακολουθεί μια στρατηγική εξειδίκευσης (coarse to fine) χρησιμοποιώντας δίκτυα συναρτήσεων ακτινικής βάσης (Radial Basis Function Networks, RBFNs) που εκπαιδεύονται σε ένα μεγάλο σύνολο συνθετικών δεδομένων. Η δημιουργία των συνθετικών δεδομένων που απαιτούνται για την εκπαίδευση των δικτύων ξεκινάει καταγράφοντας μια πραγματική ακολουθία ενός ανθρώπινου χεριού που εκτελεί διαφορετικές χειρονομίες. Στη συνέχεια εκτιμάται η πόζα του χεριού για κάθε καρέ της ακολουθίας χρησιμοποιώντας μια μέθοδο παρακολούθησης χεριών με υψηλό υπολογιστικό φόρτο, επιτυγχάνοντας ακριβείς εκτιμήσεις. Από αυτό το σύνολο όλων των ανακτημένων ποζών, επιλέγουμε αυτές που διαφέρουν περισσότερο μεταξύ τους. Χρησιμοποιούμε αυτό το αντιπροσωπευτικό σύνολο, μαζί με μια πυκνή δειγματοληψία όλων των πιθανών περιστροφών για να δημιουργήσουμε το συνθετικό σύνολο εκπαίδευσης. Ένα δίκτυο αρχικοποίησης και πολλαπλά εξειδικευμένα δίκτυα εκπαιδεύονται σε τμήματα του συνόλου συνθετικών δεδομένων. Υπάρχουν δύο ειδών εξειδικευμένα δίκτυα. Η μία κατηγορία, περιλαμβάνει δίκτυα που είναι κατάλληλα εκπαιδευμένα για να ανακτήσουν τον προσανατολισμό των χεριών με δεδομένη την άρθρωση των δακτύλων. Η δεύτερη κατηγορία ανακτά την άρθρωση δεδομένου του προσανατολισμού του χεριού. Λαμβάνοντας σαν είσοδο ένα καρέ βάθους, χρησιμοποιούμε τα εκπαιδευμένα μοντέλα για να ανακτήσουμε την πόζα του χεριού. Για το σκοπό αυτό, το δίκτυο αρχικοποίησης χρησιμοποιείται για την εκτίμηση μιας αρχικής πόζας. Στη συνέχεια, τα εξειδικευμένα δίκτυα χρησιμοποιούνται σε ένα επαναληπτικό σχήμα που έχει σκοπό να βελτιώσει την αρχική εκτίμηση. Αυτό το επαναληπτικό σχήμα βελτίωσης εκτελείται για έναν προκαθορισμένο αριθμό επαναλήψεων, μετά την ολοκλήρωση του οποίου ανακτάται η εκτίμηση πόζας. Το συνολικό υπολογιστικό κόστος της προτεινόμενης προσέγγισης καθορίζεται από τις υπολογιστικές απαιτήσεις ενός μικρού πλήθους δικτύων RBFN, επιτυγχάνοντας επιδόσεις σχεδόν πραγματικού χρόνου. Επιπλέον, η προτεινόμενη μέθοδος επιδέχεται επιτάχυνσης μέσω παραλληλοποίησης, χάρη στον εγγενή παραλληλισμό των δικτύων RBFN. Η μέθοδος απαιτεί λίγα πραγματικά δεδομένα και σχεδόν καθόλου επισημείωση. Επιπλέον, έχει λίγες υπερ-παραμέτρους οι οποίες διερευνούνται πειραματικά για να προσδιοριστούν οι βέλτιστες τιμές τους. Η ποσοτική αξιολόγηση της μεθόδου βασίστηκε σε μια πραγματική ακολουθία για την οποία γνωρίζουμε τις πραγματικές πόζες του χεριού (ground truth). Επιπλέον, παρουσιάζουμε ποσοτικά αποτελέσματα σε ένα κοινά διαθέσιμο σύνολο δεδομένων (public dataset) που χρησιμοποιείται για την αξιολόγηση των μεθόδων εκτίμησης και παρακολούθησης πόζας χεριών. Ποιοτικά αποτελέσματα παρουσιάζονται και για τα δύο σύνολα δεδομένων τα οποία δείχνουν ότι η προσέγγισή μας επιτυγχάνει ικανοποιητικά αποτελέσματα σε όλες τις περιπτώσεις. Συμπερασματικά, η εργασία αυτή δείχνει ότι προτεινόμενη προσέγγιση για εκτίμηση της 3Δ πόζας του χεριού που βασίζεται σε δίκτυα RBFN μπορεί να γενικεύσει αρκετά καλά σε πραγματικά δεδομένα, ενώ έχει εκπαιδευθεί σε συνθετικά δεδομένα.
Φυσική περιγραφή vi, 59 σ. : σχεδ., πιν., εικ. (μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Artificial neural networks
Hand pose estimation
Radial basis function networks
Synthetic data
Δίκτυα συναρτήσεων ακτινικής βάσης
Εκτίμηση πόζας χεριού
Συνθετκκά δεδομένα
Τεχνητά νευρωνικά δίκτυα
Ημερομηνία έκδοσης 2018-03-23
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 11

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 1