Your browser does not support JavaScript!

Αρχική    Evaluating design options of Bag-of Visual-Words based methods for action classification  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000413380
Τίτλος Evaluating design options of Bag-of Visual-Words based methods for action classification
Άλλος τίτλος Αξιολόγηση σχεδιαστικών επιλογών μεθόδων βασιζόμενων σε συλλογή οπτικών λέξεων για την κατηγοριοποίηση ανθρώπινων δραστηριοτήτων
Συγγραφέας Μανουσάκη, Βικτωρία Ε.
Σύμβουλος διατριβής Αργυρός, Αντώνης
Μέλος κριτικής επιτροπής Στεφανίδης, Κωνσταντίνος
Ζαμπούλης, Ξενοφών
Περίληψη Τα τελευταία χρόνια, τα προβλήματα της ανάλυσης και της κατηγοριοποίησης / αναγνώρισης των ανθρώπινων δράσεων με βάση οπτική πληροφορία έχουν προσελκύσει μεγάλο ερευνητικό ενδιαφέρον εξαιτίας της σημασίας της επίλυσής τους σε τομείς όπως η υποβοηθούμενη διαβίωση, η επιτήρηση χώρων, η αλληλεπίδραση ανθρώπου-υπολογιστή/ρομπότ, κλπ. Παρά τη σημαντική πρόοδο που έχει επιτευχθεί, η κατηγοριοποίηση και η αναγνώριση των ανθρώπινων δράσεων παραμένει ένα δύσκολο πρόβλημα που δεν έχει επιλυθεί στη γενικότητά του. Σε αυτή την εργασία, μας ενδιαφέρει η κατηγοριοποίηση ανθρώπινων δράσεων με βάση 3Δ σκελετικά δεδομένα και βασιζόμαστε στη μέθοδο της Συλλογής Οπτικών Λέξεων-ΣΟΛ (Bags of Visual Words-BoVWs) που αποτελεί ένα αρκετά επιτυχημένο πλαίσιο κωδικοποίησης χαρακτηριστικών για την επίλυση αυτού του προβλήματος. Ακολουθούμε ένα σχήμα κατηγοριοποίησης δράσεων που αποτελείται από τρία βασικά βήματα: (α) εξαγωγή χαρακτηριστικών, (β) αναπαράσταση / κωδικοποίηση βασισμένη σε συλλογή κωδικοποιημένων οπτικών χαρακτηριστικών και (γ) κατηγοριοποίηση των παραστάσεων δράσης που προκύπτουν. Σε αυτή τη μελέτη, ο στόχος μας είναι να παρέχουμε μια πειραματική αξιολόγηση διαφόρων σχεδιαστικών επιλογών για τα παραπάνω βήματα, οι οποίες, εφόσον προσδιοριστούν, οδηγούν σε συγκεκριμένες και διαφορετικές μεθόδους κατηγοριοποίησης δράσεων. Σε αυτή την κατεύθυνση, οι συνεισφορές αυτής της εργασίας είναι πολλές. Αρχικά, ερευνούμε την απόδοση τριών υφιστάμενων τύπων 3Δ σκελετικών χαρακτηριστικών. Προτείνουμε επίσης ένα νέο χαρακτηριστικό για την αναπαράσταση της 3Δ στάσης του ανθρώπινου σώματος που εμπνέεται από υφιστάμενη έρευνα σε Ιστογράμματα Ορίου Κίνησης-ΙΟΚ (Motion Boundary Histograms–MBH). Η χρήση του προτεινόμενου χαρακτηριστικού φαίνεται να παράγει αποτελέσματα που είναι ανταγωνιστικά με αυτά των κορυφαίων υφιστάμενων ανταγωνιστικών μεθόδων. Εξετάζουμε τρεις διαφορετικές μεθόδους κατηγοριοποίησης (Κ-Κοντινότεροι Γείτονες-ΚΚΓ, Μηχανές Διανυσμάτων Υποστήριξης - ΜΔΥ, Νευρωνικό Δίκτυο Συνάρτησης Ακτινικής Βάσης - ΝΔΣΑΒ). Διερευνούμε επίσης το μέγεθος της συλλογής κωδικών που χρησιμοποιείται για την αναπαράσταση δράσεων, το οποίο αποτελεί σημαντική σχεδιαστική επιλογή σε μεθόδους που βασίζονται σε ΣΟΛ. Για να επιτευχθεί αυτό, βασιζόμαστε σε μια εμπειρική, σχεδόν εξαντλητική μελέτη για να καθορίσουμε το καλύτερο μέγεθος συλλογής κωδίκων για κάθε τύπο χαρακτηριστικού και μεθόδου κατηγοριοποίησης. Οι περισσότερες υφιστάμενες εργασίες ορίζουν ένα συγκεκριμένο μέγεθος συλλογής κωδικών χωρίς να παρέχουν λεπτομέρειες για το πώς αυτό αποφασίζεται. Αντιθέτως, εμείς διερευνούμε μεθόδους που καθορίζουν αυτόματα το μέγεθος της συλλογής. Τα αποτελέσματα της διερεύνησης δείχνουν ότι η μέθοδος Διάδοσης Συνάφειας (Affinity Propagation), μια τεχνική μη επιτηρούμενης ομαδοποίησης που καθορίζει αυτόματα τον αριθμό των συστάδων σε ένα σύνολο δεδομένων, μπορεί να χρησιμοποιηθεί αποτελεσματικά ως αντικατάσταση του αλγόριθμου K-μέσων (k-Means) που χρησιμοποιείται στις περισσότερες από τις μεθόδους κατηγοριοποίησης που βασίζονται σε ΣΟΛ. Επιπρόσθετα, διερευνάμε εναλλακτικές προσεγγίσεις κωδικοποίησης χαρακτηριστικών όπως οι Συλλογή Χρονικών Λέξεων - ΣΧΛ (Bag of Temporal Words-BoTW) και τα Διανύσματα Τοπικά Συσσωρευμένων Περιγραφών -ΔΤΣΠ (Vector of Locally Aggregated Descriptors-VLAD). Τα αποτελέσματα που προκύπτουν δείχνουν ότι η σχετικά απλούστερη κωδικοποίηση ΣΟΛ υπερέχει έναντι αυτών των πολυπλοκότερων επιλογών. Όλες οι επιλογές σχεδιασμού μεθόδων ταξινόμησης δράσεων αξιολογήθηκαν βάσει μιας σειράς πειραμάτων που πραγματοποιήθηκαν στο ευρέως χρησιμοποιούμενο σύνολο δεδομένων κίνησης και ανθρώπινων δραστηριοτήτων Berkeley MHAD. Τo σύνολο δεδομένων MHAD είναι επισημειωμένο με τις ορθές κατηγορίες ανθρώπινων δράσεων, γεγονός που επιτρέπει την ποσοτική αποτίμηση των σχετικών αυτοματοποιημένων μεθόδων κατηγοριοποίησης.
Φυσική περιγραφή x, 67 σ. : σχεδ., πιν., εικ. (μερ. εγχρ) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα KNN
MBH
RBFNN
SVM
VLAD
VLAD
Ημερομηνία έκδοσης 2017-11-24
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 72

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 3