Your browser does not support JavaScript!

Αρχική    Multichannel audio modeling and coding for immersive audio based on the sinusoidal model  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000318795
Τίτλος Multichannel audio modeling and coding for immersive audio based on the sinusoidal model
Άλλος τίτλος Μοντελοποίηση και Κωδικοποίηση Πολυκαναλικού Ήχου για Εφαρμογές Εικονικού Ήχου με Χρήση του Ημιτονοειδούς Μοντέλου
Συγγραφέας Τζαγκαράκης, Χρήστος
Σύμβουλος διατριβής Τσακαλίδης, Παναγιώτης
Περίληψη Τα τελευταία χρόνια, ο πολυκαναλικός ήχος σταδιακά ξεκίνησε να αντικαθιστά τα συστήματα στερεοφωνικού ήχου λόγω του ότι προσφέρει σημαντικά πλεονεκτήματα αναπαραγωγής του ήχου συγκρινόμενος με τον στερεοφωνικό ήχο. Ο μεγάλος αριθμός των καναλιών δίνει στον ακροατή την αίσθηση ότι «περικλείεται» από τον ήχο και του δίνει την εικόνα μιας πιο ρεαλιστικής ακουστικής σκηνής δίνοντάς του την αίσθηση ότι βρίσκεται στο χώρο της ηχογράφησης. Όμως, το βασικό πρόβλημα με τον αυξημένο αριθμό των καναλιών είναι η ανάγκη για υψηλότερους ρυθμούς μετάδοσης δεδομένων με στόχο την αποθήκευση ή/και την μετάδοση των πολλαπλών καναλιών. Συνεπώς, αρκετοί αλγόριθμοι συμπίεσης πολυκαναλικού ήχου έχουν αναπτυχθεί με σκοπό την περαιτέρω μείωση του ρυθμού μετάδοσης δεδομένων, εκμεταλλευόμενοι το γεγονός ότι τα πολλαπλά κανάλια παρουσιάζουν ομοιότητες μεταξύ τους. Αυτοί οι αλγόριθμοι συμπίεσης επιτυγχάνουν σημαντικό κέρδος στην κωδικοποίηση, αλλά παραμένουν ακόμα απαιτητικοί για πολλές πρακτικές εφαρμογές χαμηλού εύρους μετάδοσης. Αντικειμενικός σκοπός μας είναι η πρόταση μιας μεθόδου μοντελοποίησης και κωδικοποίησης που θα επιτυγχάνει όσο το δυνατόν χαμηλότερους ρυθμούς μετάδοσης δεδομένων για εφαρμογές πολυκαναλικού αλλά και εικονικού ήχου όπως η εξ αποστάσεως μίξη της πολυκαναλικής εγγραφής και η εξ αποστάσεως συνεργασία μουσικών που είναι διάσπαρτοι γεωγραφικά. Το γεγονός αυτό μεταφράζεται στο να παράγουμε ένα μοντέλο το οποίο θα εκμεταλλεύεται τις ομοιότητες μεταξύ των διαφόρων μικροφωνικών σημάτων μιας δεδομένης πολυκαναλικής εγγραφής. Στην παρούσα εργασία, προτείνουμε την κωδικοποίηση ενός ηχητικού καναλιού (το οποίο μπορεί να είναι ένα από τα πολλαπλά μικροφωνικά σήματα μιας πολυκαναλικής εγγραφής ή ένα σήμα που έχει προέλθει από την υπέρθεση πολλών ηχητικών καναλιών), ενώ από τα εναπομείναντα κανάλια διατηρούμε μόνο εκείνες τις παραμέτρους που επιτρέπουν την ανασύνθεση του περιεχομένου τους στον αποκωδικοποιητή. Αυτή η μέθοδος υλοποιείται μέσω της κατάλληλης προσαρμογής του μοντέλου «ημίτονα συν θόρυβος». Σύμφωνα με αυτό το μοντέλο, ένα σήμα ήχου μπορεί να αναλυθεί σε ένα ντετερμινιστικό (ημιτονοειδούς φύσεως) μέρος και σε ένα στοχαστικό μέρος που θεωρείται ότι αποτελεί θόρυβο. Η προτεινόμενη προσέγγισή μας βασίζεται στην παρατήρηση ότι το στοχαστικό μέρος κάθε καναλιού μπορεί να δημιουργηθεί μετασχηματίζοντας το στοχαστικό μέρος ενός από τα κανάλια (το οποίο ονομάζεται κανάλι αναφοράς), χρησιμοποιώντας σε αυτόν τον μετασχηματισμό τη φασματική περιβάλλουσα του στοχαστικού μέρους ενός εκ των υπολοίπων καναλιών. Η διαδικασία της κωδικοποίησης μπορεί να χωριστεί σε δύο μέρη: (1) στην κωδικοποίηση των παραμέτρων του ντετερμινιστικού (ημιτονοειδούς) μέρους και (2) στην κωδικοποίηση των φασματικών περιβαλλουσών του στοχαστικού μέρους των καναλιών. Η κωδικοποίηση των παραμέτρων του ημιτονοειδούς μέρους βασίζεται σε μία μέθοδο κβαντισμού υψηλού ρυθμού (high-rate quantization), ενώ η συμπίεση της κάθε φασματικής περιβάλλουσας του στοχαστικού μέρους σε μία μέθοδο διανυσματικού κβαντισμού (vector quantization) η οποία εφαρμόζεται κυρίως στην κωδικοποίηση σημάτων φωνής. Η απόδοση του προτεινόμενου συστήματος της κωδικοποίησης αποτιμάται μέσω υποκειμενικών ακουστικών πειραμάτων. Συγκεκριμένα, τα αποτελέσματα δείχνουν ότι με την μέθοδο που προτείνεται μπορεί να επιτευχθεί ταχύτητα μετάδοσης της τάξης των 18 kbps για κάθε κανάλι για υψηλής ποιότητας κωδικοποίηση. Στην παρούσα εργασία γίνεται για πρώτη φορά χρήση του ημιτονοειδούς μοντέλου στην περιοχή του πολυκαναλικού ήχου για υψηλής ποιότητας κωδικοποίηση.
Φυσική περιγραφή 93 σ. : εικ. ; 30 cm.
Γλώσσα Αγγλικά
Ημερομηνία έκδοσης 2007-12-07
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 445

Ψηφιακά τεκμήρια
No preview available

Κατέβασμα Εγγράφου
Προβολή Εγγράφου
Εμφανίσεις : 10