Your browser does not support JavaScript!

Διδακτορικές διατριβές

Εντολή Αναζήτησης : Συγγραφέας="Παπαγιαννάκης"  Και Συγγραφέας="Γεώργιος"

Τρέχουσα Εγγραφή: 10 από 94

Πίσω στα Αποτελέσματα Προηγούμενη σελίδα
Επόμενη σελίδα
Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000417143
Τίτλος DRACOSS : a framework for direction of arrival estimation and counting of multiple sound sources with microphone arrays
Άλλος τίτλος DRACOSS: ένα ολοκληρωμένο πλαίσιο για εκτίμηση πλήθους και κατεύθυνσης άφιξης πολλαπλών ηχητικών πηγών με συστοιχίες μικροφώνων
Συγγραφέας Παυλίδη, Δέσποινα Απόστολος
Σύμβουλος διατριβής Μούχταρης, Αθανάσιος
Μέλος κριτικής επιτροπής Τσακαλίδης, Παναγιώτης
Pulkki, Ville
Περίληψη Οι τεχνολογικές εξελίξεις έχουν διεισδύσει στην καθημερινότητα μας όπως ποτέ άλλοτε. Συσκευές υψηλής νοημοσύνης, εξοπλισμένες με αλγορίθμους τελευταίας τεχνολογίας, διευκολύνουν και ενισχύουν τον τρόπο ζωής μας. Συστήματα αυτοματισμού για έξυπνα σπίτια, ακουστικά βαρηκοΐας επόμενης γενιάς, ρομπότ με αυτόνομα συστήματα πλοήγησης φέρνουν στο προσκήνιο της επιστημονικής κοινότητας προβλήματα επεξεργασίας σημάτων ήχου. Ένα από αυτά τα προβλήματα είναι η εκτίμηση του πλήθους και των κατευθύνσεων από τις οποίες προέρχεται ο ήχος, αυτό που συνήθως ονομάζουμε εκτίμηση κατεύθυνσης άφιξης. Το πρόβλημα της εκτίμησης κατεύθυνσης άφιξης είναι ενεργό για πάνω από τριάντα χρόνια, συνεπώς πληθώρα αλγορίθμων έχει προταθεί στη σχετική βιβλιογραφία. Μερικοί από αυτούς τους αλγορίθμους προέρχονται από την περιοχή των τηλεπικοινωνιών. Σε αυτήν την κατηγορία ανήκουν οι τεχνικές διαμόρφωσης δέσμης, στις οποίες χρησιμοποιώντας κατάλληλα βάρη, ένα άθροισμα των σημάτων μίας συστοιχίας μικροφώνων σχηματίζει μία δέσμη δέκτη που σαρώνει το χώρο και ανιχνεύει περιοχές ακουστικής δραστηριότητας. Οι προσεγγίσεις υποχώρων, όπως ο διάσημος αλγόριθμος MUSIC, διαμορφώνουν μία χωρική συνάρτηση η οποία μεγιστοποιείται στα σημεία που ανιχνεύεται δραστηριότητα χρησιμοποιώντας την αποσύνθεση της δειγματικής μήτρας ετεροδιακύμανσης της συστοιχίας. Άλλοι αλγόριθμοι έχουν αναδυθεί μέσα από τις προσπάθειες διαχωρισμού μειγμάτων ηχητικών σημάτων. Σε αυτήν την κατηγορία ανήκουν οι μέθοδοι που στηρίζονται στην ανάλυση ανεξάρτητων στοιχείων, στοχεύοντας στην εκτίμηση μίας μήτρας διαχωρισμού που εμπεριέχει πληροφορία για την κατεύθυνση άφιξης, καθώς και οι μέθοδοι ανάλυσης αραιών στοιχείων που εκμεταλλεύονται την αραιότητα της δραστηριότητας των πηγών σε κάποιον κατάλληλα επιλεγμένο χώρο. Μία προσέγγιση που έχει τραβήξει πρόσφατα το ενδιαφέρον είναι αυτή της εκτίμησης του διανύσματος έντασης του ηχητικού πεδίου, το οποίο έχει κατεύθυνση προς την καθαρή ροή ηχητικής ενέργειας, συνεπώς μπορεί να παρέχει την κατεύθυνση άφιξης της γεννήτριας ηχητικής πηγής. Οι προαναφερθείσες μεθοδολογίες αποτυγχάνουν είτε στην ακριβή εκτίμηση της κατεύθυνσης άφιξης όταν πολλαπλές πήγες είναι ταυτόχρονα ενεργές, όπως οι τεχνικές διαμόρφωσης δέσμης, είτε ενέχουν υψηλό υπολογιστικό κόστος και εξαρτώνται σημαντικά από τον όγκο των διαθέσιμων δεδομένων, όπως οι τεχνικές ανεξαρτήτων στοιχείων και υποχώρων, ενώ κάποιοι αλγόριθμοι απευθύνονται σε συγκεκριμένες τοπολογίες συστοιχιών μικροφώνων. Διαφαίνεται, συνεπώς, η έλλειψη κάποιας μεθοδολογίας που να αντιμετωπίζει το πρόβλημα της εκτίμησης κατεύθυνσης άφιξης ολιστικά και να μπορεί να ανταπεξέλθει σε όλες τις διαφορετικές πτυχές του προβλήματος. Σε αυτήν τη διατριβή αποσκοπούμε να καλύψουμε αυτό το κενό και προτείνουμε ένα ολοκληρωμένο πλαίσιο για την επίλυση του προβλήματος εκτίμησης πλήθους και κατεύθυνσης άφιξης πολλαπλών, ταυτόχρονα ενεργών πηγών με τη χρήση συστοιχιών μικροφώνων. Το πλαίσιο, το οποίο ονομάζουμε εφεξής DRACOSS, αναπτύσσεται σε διδιάστατους και τριδιάστατους χώρους, χρησιμοποιώντας μία ομοιόμορφη, κυκλική συστοιχία και μία σφαιρική συστοιχία μικροφώνων αντίστοιχα. Το DRACOSS αποτελεί ουσιαστικά μία διαδικασία τεσσάρων ευκρινών βημάτων: (α) εκμετάλλευση της αραιότητας των ηχητικών σημάτων, (β) τοπική εκτίμηση κατεύθυνσης άφιξης μίας πηγής, (γ) σχηματισμός ιστογράμματος, και (δ) επεξεργασία του ιστογράμματος. Ανιχνεύουμε την αραιότητα των ηχητικών σημάτων στο πεδίο των χρονοσυχνοτήτων χρησιμοποιώντας μία χαλαρή υπόθεση αραιότητας που στηρίζεται στην εκτίμηση ενός συντελεστή μέσης συσχέτισης μεταξύ σημάτων ζευγών μικροφώνων. Σε επόμενο βήμα συλλέγουμε τοπικές εκτιμήσεις κατεύθυνσης άφιξης από όλες τις περιοχές μοναδιαίας δραστηριότητας, τις οποίες και χρησιμοποιούμε για να σχηματίσουμε ιστογράμματα. Σε διδιάστατους χώρους, ως τοπικό εκτιμητή κατεύθυνσης χρησιμοποιούμε έναν αλγόριθμο ειδικά σχεδιασμένο για κυκλικές συστοιχίες και σχηματίζουμε μονοδιάστατα ιστογράμματα, ενώ για τους τριδιάστατους χώρους χρησιμοποιούμε εκτιμήσεις του διανύσματος ηχητικής έντασης και σχηματίζουμε διδιάστατα ιστογράμματα. Και σ τις δύο περιπτώσεις με περαιτέρω επεξεργασία των ιστογραμμάτων παρέχουμε εκτιμήσεις του πλήθους και των κατευθύνσεων άφιξης όλων των ενεργών ηχητικών πηγών. Το DRACOSS παρουσιάζει εύρωστη απόδοση τόσο σε προσομοιωμένα, όσο και σε πραγματικά σενάρια, για διάφορες συνθήκες θορύβου και ανακλάσεων και για διάφορα πλήθη εμπλεκόμενων πηγών. Επίσης, το προτεινόμενο πλαίσιο υπερέχει πολλών, γενικώς αναγνωρισμένων μεθόδων της βιβλιογραφίας. Επιπροσθέτως προτείνουμε την ανάπτυξη δύο κλασικών μεθόδων εκτίμησης άφιξης, της μεθόδου σχηματισμού δέσμης και του αλγορίθμου MUSIC, υπό το προτεινόμενο πλαίσιο DRACOSS, βελτιώνοντας έτσι σημαντικά την απόδοσή τους. Αποσκοπώντας στη συνεχή βελτίωση της προσέγγισής μας, ακολουθώντας, δε, τις τελευταίες τεχνολογικές τάσεις, παρουσιάζουμε πρόσφατα και πολλά υποσχόμενα αποτελέσματα αναφορικά με την εκτίμηση πλήθους ενεργών πηγών, χρησιμοποιώντας βαθιά νευρωνικά δίκτυα.
Φυσική περιγραφή xxx, 123 σ. : σχεδ., πιν., εικ. (μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Histogram processing
Sound intensity vector
Sparsity
Spherical harmonic domain
Spherical microphone arrays
Time-frequency domain
Αραιότητα
Διάνυσμα ηχητικής έντασης
Επεξεργασία ιστογραμμάτων
Σφαιρικές συστοιχίες μικροφώνων
Χώρος σφαιρικών αρμονικών συνιστωσών
Χώρος χρονο-συχνοτήτων
Ημερομηνία έκδοσης 2018-07-20
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Διδακτορικές διατριβές
  Τύπος Εργασίας--Διδακτορικές διατριβές
Μόνιμη Σύνδεση https://elocus.lib.uoc.gr//dlib/f/0/a/metadata-dlib-1531378806-10323-5366.tkl Bookmark and Share
Εμφανίσεις 244

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 7