Περίληψη |
Η ανάκτηση και παρακολούθηση της πόζας του αρθρωτού ανθρώπινου σώματος,
χωρίς την χρήση οπτικών σημαδιών, είναι ένα απαιτητικό πρόβλημα με σημαντικές
θεωρητικές και πρακτικές
πτυχές. Η πρόσφατη εισαγωγή καμερών βάθους (
RGB
-
D
cameras
) χαμηλού κόστους είχε ως αποτέλεσμα την εμφάνιση ενός πλήθους από νέες
ενδιαφέρουσες και αποδοτικές προσεγγίσεις στο πρόβλημα. Ωστόσο, παρά την
αξιοσημείωτη πρόοδο, η εκτίμηση της πόζας του σώματος
σε ρεαλιστικά και
πολύπλοκα περιβάλλοντα παραμένει ένα ανοιχτό και άκρως ενδιαφέρων ερευνητικό
θέμα.
Στην παρούσα διατριβή σχεδιάσαμε, αναπτύξαμε και αξιολογήσαμε μια
μεθοδολογία για την ανάκτηση και παρακολούθηση της πόζας ολόκληρου του
σώματος χωρίς τη
χρήση οπτικών σημαδιών, σε ακολουθίες από RGB
-
D δεδομένα. Η
προτεινόμενη μεθοδολογία βασίζεται στη μοντελοποίηση του ανθρώπινου σώματος,
και μπορεί να εφαρμοστεί χωρίς περιορισμούς στο σενάριο δράσης των χρηστών. Πιο
συγκεκριμένα, οι χρήστες μπορούν να μπαίνουν και να βγαίνουν ελεύθερα από τη
σκηνή, να μετακινούνται, να ενεργούν και να αλληλεπιδρούν με άλλους χρήστες ή το
ίδιο το περιβάλλον. Η έρευνά μας επικεντρώνεται κυρίως στην αντιμετώπιση
προβλημάτων που προκύπτουν από επικαλύψεις, είτε μεταξύ μερών του σώματος
του ίδιου χρήστη, είτε μεταξύ διαφορετικών χρηστών. Ταυτόχρονα, επιχειρούμε να
αντιμετωπίσουμε επιπλέον σημαντικά θέματα, όπως οι μεγάλες διαφορές των
ανθρώπινων σωμάτων ή η χωρίς περιορισμούς εκκίνηση της παρακολούθησης.
Προς αυτή την κατεύθυνση, εισαγάγαμε την καινοτόμα έννοια της Προβολής
Κάτοψης (ΠΚ
-
Top
View
Reprojection
) για κυλινδρικά αντικείμενα, η οποία μπορεί
να ορίσει μονοσήμαντα την πόζα του κυλινδρικού αντικείμενου βασιζόμενη σε
συγκεκριμένα ποσοτικά χαρακτηριστικά της Κάτοψής του,
δηλαδή της όψης η οποία
είναι ευθυγραμμισμένη με τον κύριο άξονα του κυλίνδρου. Δεδομένου αυτού, το
πρόβλημα της εκτίμησης της πόζας ενός κυλινδρικού αντικειμένου μεταφράζεται
στην εκτίμηση της αντίστοιχης Κάτοψης. Η χρησιμοποιούμενη διατύπωση παραμένει
ανεπηρέαστη από παράγοντες όπως θορυβώδη ή ελλιπή δεδομένα.
Για να επωφεληθούμε από την έννοια της ΠΚ, αναπαριστούμε το ανθρώπινο σώμα
ως ένα μοντέλο βασισμένο σε κυλίνδρους, αποτελούμενο από 11 μέρη. Το σώμα
αντιμετωπίζεται ομοιόμορφα μέσα από το πλαίσιο
της ΠΚ, ακολουθώντας μια
τεχνική τοπικής βελτιστοποίησης. Τα μέρη, τα οποία αναπαρίστανται ως κύλινδροι,
εξετάζονται σε μια από
-
πάνω
-
προς
-
τα
-
κάτω σειριακή δομή, εκκινώντας από το
κεφάλι. Για κάθε μέρος του σώματος, δημιουργείται ένα σύνολο από υποθέσεις
πόζας, το οποίο και παρακολουθείται στο χρόνο από ένα Φίλτρο Σωματιδίων (Particle
Filter). Για να αξιολογήσουμε κάθε υπόθεση, χρησιμοποιούμε μια καινοτόμα μετρική
η οποία λαμβάνει υπόψη την εικονική Κάτοψη του αντίστοιχου μέρους σώματος.
Αυτό, σε συνδυασμό με την πληροφορία βάθους, μπορεί να αντιμετωπίσει επιτυχώς
δύσκολες και αμφισβητήσιμες περιπτώσεις, όπως αυτές που προκύπτουν από
έντονες επικαλύψεις, είτε μεταξύ μερών του ίδιου χρήστη, είτε μεταξύ διαφορετικών
χρηστών.
Για την αξιολόγηση της εν λόγω μεθοδολογίας, διεξήχθησαν εκτεταμένα πειράματα
τα οποία στοχεύουν σε ρεαλιστικά σενάρια, με αύξοντα βαθμό δυσκολίας και με
κυμαινόμενο πλήθος χρηστών να αλληλεπιδρούν μεταξύ τους. Επιπροσθέτως
συγκρίναμε την απόδοση της προτεινόμενης μεθόδου με την απόδοση των
επικρατέστερων σύγχρονων μεθόδων, χρησιμοποιώντας δεδομένα διαθέσιμα από
τον παγκόσμιο ιστό και δικά μας δεδομένα τα οποία εμπεριέχουν πληροφορία για
την πραγματική πόζα των χρηστών. Τόσο τα ποιοτικά όσο και τα ποσοτικά
αποτελέσματα που παρουσιάζονται πιστοποιούν την αποδοτικότητα της μεθόδου μας.
|