|
Κωδικός Πόρου |
000434012 |
Τίτλος |
Machine learning techniques for the detection of illegal human activity in audio recordings from protected areas |
Άλλος τίτλος |
Χρήση τεχνικών μηχανικής μάθησης για τον εντοπισμό ανθρωπογενούς δραστηριότητας από ηχογραφήσεις σε προστατευόμενες περιοχές |
Συγγραφέας
|
Ψαρουλάκης, Κωνσταντίνος Σ.
|
Σύμβουλος διατριβής
|
Τσακαλίδης, Παναγιώτης
|
Μέλος κριτικής επιτροπής
|
Στεφανάκης, Νικόλαος
Στυλιανού, Γιάννης
|
Περίληψη |
Η ανθρώπινη δραστηριότητα αποτελεί σήμερα τη σημαντικότερη αιτία εξαφάνισης βιοτόπων μεγάλου
αριθμού φυτών και ζώων στον πλανήτη. Αυτή η δραστηριότητα οδηγεί στην ολική εξαφάνιση πολλών
ειδών και στη αποδυνάμωση των οικοσυστημάτων, γεγονός που διαταράσσει τις ισορροπίες στον
πλανήτη και την ποιότητα ζωής του ανθρώπου. Ένα μέτρο προστασίας είναι η θέσπιση
προστατευμένων περιοχών όπου η ανθρώπινη δραστηριότητα είναι περιορισμένη. Σε αυτές τις
περιοχές, συστήματα ασφαλείας αποτελούμενα από κάμερες και μικρόφωνα μπορούν να συμβάλλουν
στην παρακολούθηση της ισορροπίας του εκάστοτε οικοσυστήματος καθώς και στην αποτροπή
ανθρώπινης δραστηριότητας που αποτελεί απειλή για το περιβάλλον.
Αυτή η εργασία επικεντρώνεται στην εφαρμογή τεχνικών μηχανικής μάθησης και επεξεργασίας
σήματος σε ηχογραφήσεις από προστατευόμενες περιοχές στην Ελλάδα, με σκοπό τον αυτόματο
εντοπισμό ηχητικών γεγονότων που σηματοδοτούν παράνομη ανθρώπινη δραστηριότητα (παράνομη
υλοτομία, βόσκηση, κυνήγι κ.α.).
Για τη συλλογή και κατηγοριοποίηση των δεδομένων που απαιτούνται για την εκπαίδευση των
μοντέλων μηχανικής μάθησης, παρουσιάζουμε τη χρησιμότητα μιας μεθόδου εντοπισμού φωνής που
ενεργοποιείται με την ύπαρξη αρμονικής δομής σε ένα σήμα ήχου. Η μέθοδος αξιοποιείται για την
αυτόματη κατάτμηση εκατοντάδων ωρών ηχογράφησης σε χιλιάδες μικρής διάρκειας ηχητικά
αποσπάσματα που εν δυνάμει φέρουν το υποκείμενο μοτίβο ενδιαφέροντος.
Στη συνέχεια, εκτελούμε πειράματα με στόχο την εύρεση της βέλτιστης προσέγγισης για ένα πρόβλημα
δυαδικής ταξινόμησης που επικεντρώνεται την περίπτωση του ήχου του αλυσοπρίονου και ένα
πρόβλημα έξι κλάσεων που περιλαμβάνει πρόσθετα ηχητικά μοτίβα σχετικά με την παράνομη
δραστηριότητα. Τα αποτελέσματα που παρουσιάζουμε αναδεικνύουν την υπεροχή των Βαθιών
Νευρωνικών Δικτύων έναντι γνωστών συμβατικών προσεγγίσεων και αναδεικνύουν βέλτιστες επιλογές
όσον αφορά τις αρχιτεκτονικές των δικτύων και τον τύπο των ακουστικών χαρακτηριστικών ανάλογα με
το εκάστοτε πρόβλημα ταξινόμησης.
|
Φυσική περιγραφή |
vi, 68 σ. : σχεδ., πιν., εικ.(μερ. εγχρ.) ; 30 εκ. |
Γλώσσα |
Αγγλικά |
Θέμα |
Chainsaw |
|
Classification |
|
Neural network |
|
Voice |
|
Ήχος |
|
Αλυσοπρίονο |
|
Ανίχνευση |
|
Εντοπισμός |
|
Ηχογράφηση |
|
Μηχανική μάθηση |
|
Νευρωνικά δίκτυα |
|
Παράνομη ανθρωπογενής δραστηριότητα |
|
Ταξινόμηση |
Ημερομηνία έκδοσης |
2020-11-27 |
Συλλογή
|
Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
|
|
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
|
Εμφανίσεις |
555 |