Περίληψη |
Η ανίχνευση ανθρώπινων προσώπων αν και επιτελείται στιγμιαία, αβίαστα και με ενδεικτική ακρίβεια από τον ανθρώπινο εγκέφαλο, για την έρευνα της υπολογιστικής όρασης είναι ακόμα ένα θέμα υπό ανάπτυξη. Επιπρόσθετα, το μεγάλο εύρος πρακτικών εφαρμογών της όπως η αυτόματη προετοιμασία δεδομένων για την αναγνώριση προσώπου, η ανάκτηση εικόνας με βάση το περιεχόμενο ή η προχωρημένη αλληλεπίδραση μεταξύ ανθρώπου και μηχανής, την καθιστούν ως ένα πρόβλημα με θεωρητική αλλά κκαι πρακτική αξία. Ο σκοπός της παρούσας εργασίας ήταν η εισαγωγή των Συνελικτικών Νευρωνικών Δικτύων σαν ένας αποτελεσματικός και ταχύς ανιχνευτής προσώπων, ικανός να λειτουργεί σε μη ελεγχόμενα περιβάλλοντα και χωρίς καμία προεπεξεργασία. Μια συνελικτική νευρωνική τοπολογία προτείνεται, σχεδιασμένη ώστε να είναι σθεναρή σε μεταβλητές συνθήκες εικόνας και έκφρασης προσώπου ή σε άλλες δυνατές παραμορφώσεις της εισόδου. Το δίκτυο εκπαιδεύτηκε με ένα αρκετά μεγάλο σύνολο εκπαίδευσης, άμεσα προερχόμενο από φυσικά δεδομένα, μέσω του αλγορίθμου backpropagation. Χρησιμοποιώντας τα εκπαιδευμένα φίλτρα του δικτύου, επινοήθηκε μια γρήγορη διαδικασία για τη σάρωση της εικόνας, βασισμένη ολοκληρωτικά σε απλές λειτουργίες επεξεργασίας εικόνας. Το σύστημα δοκιμάστηκε σε μια σειρά από μεγάλα και δύσκολα σύνολα δοκιμής, επιδεικνύοντας πολύ υψηλά ποσοστά ανίχνευσης με λίγες και σποραδικές εσφαλμένες ειδοποιήσεις. Η σύγκριση με τα τρέχοντα πρότυπα συστήματα σε κοινά αναφερόμενα σύνολα απεκάλυψε ότι το προτεινόμενο σύστημα είναι ο καλύτερης απόδοσης ανιχνευτής προσώπων γενικής χρήσης της βιβλιογραφίας. Επιπλέον, η ανοχή του δικτύου σε μια σειρά από δυνατές παραμορφώσεις της εισόδου μετρήθηκε παι επιβεβαιώθηκε σε πειράματα ανάλυσης της ευαισθησίας.
|