Your browser does not support JavaScript!

Αρχική    Τμηματοποίηση ήχου και κατηγοριοποίηση σε μουσική και ομιλία  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου uch.csd.tcl//2000panagiotakis
Τίτλος Τμηματοποίηση ήχου και κατηγοριοποίηση σε μουσική και ομιλία
Άλλος τίτλος A Speech/Music Discriminator based on RMS and zero-crossings
Συγγραφέας Παναγιωτάκης, Κώστας
Συγγραφέας Τζιρίτας, Γιώργος
Περίληψη Τα τελευταία χρόνια γίνεται μεγάλη προσπάθεια να εξαχθεί πληροφορία από οπτικοακουστικά μέσα, ώστε να είναι δυνατή η περιγραφή του περιεχομένου των. Μ' αυτό τον τρόπο μπορούν να καταχωρηθούν σε βάσεις δεδομένων και να ανακαλούνται αυτόματα με βάση το περιεχόμενό των. Στην παρούσα εργασία αντιμετωπίζεται ο χαρακτηρισμός ενός ηχητικού σήματος που είτε αποτελεί μέρος ενός οπτικοακουστικού προγράμματος, είτε υφίσταται αυτόνομα για παράδειγμα καταγραμμένο σ' ένα ακουστικό ψηφιακό δίσκο. Σκοπός μας ήταν να αναπτυχθεί ένα σύστημα πρώτα τμηματοποίησης του ηχητικού σήματος, και έπειτα κατηγοριοποίησης σε δύο κύριες κατηγορίες: ομιλία και μουσική. Μεταξύ των απαιτήσεων συμπεριλαμβάνεται η ταχύτητα της επεξεργασίας και η απόκριση του συστήματος σε πραγματικό χρόνο. Λόγω του περιορισμού σε δύο μόνο κλάσεις τα χαρακτηριστικά που εξάγονται περιορίζονται σημαντικά και επιπλέον δεν απαιτούν πολύπλοκους υπολογισμούς. Ο πειραματικός έλεγχος έδειξε ότι οι επιδόσεις είναι εξαιρετικές, χωρίς να θυσιασθεί η απόδοση του συστήματος. Η τμηματοποίηση βασίζεται στην κατανομή του πλάτους του σήματος. ενώ στην ταξινόμηση έγινε επιπλέον χρήση ενός χαρακτηριστικού που σχετίζεται με την συχνότητα του σήματος. Ο ταξινομητής μπορεί να χρησιμοποιηθεί είτε σε συνδυασμό με την τμηματοποίηση, οπότε επιβεβαιώνει ή διαψεύδει μία αλλαγή τύπου μουσική/ομιλία ή ομιλία/μουσική, είτε αυτόνομα, σε δοσμένα τμήματα ήχου. Τα βασικά χαρακτηριστικά υπολογίζονται σε διαστήματα 20 msec, με αποτέλεσμα τα όρια των τμημάτων να προσδιορίζονται με ακρίβεια 20 msec. Η ελάχιστη διάρκεια των τμημάτων τίθεται στο ένα δευτερόλεπτο. Οι αλγόριθμοι τμηματοποίησης και κατηγοριοποίησης δοκιμάσθηκαν σε μία μεγάλη βάση από δεδομένα, με ποσοστά επιτυχούς τμηματοποίησης που ανέρχονται σε 97% και επιτυχούς ταξινόμησης κοντά στο 95%.
Γλώσσα Ελληνικά
Ημερομηνία έκδοσης 2000-11-24
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Τεχνικές αναφορές
  Τύπος Εργασίας--Τεχνικές αναφορές
Εμφανίσεις 76

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 7