Your browser does not support JavaScript!

Αρχική    On the use of neural networks and dilation for speech enhancement in a Generative Adversarial Network environment  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000438710
Τίτλος On the use of neural networks and dilation for speech enhancement in a Generative Adversarial Network environment
Άλλος τίτλος Περί της χρήσης νευρωνικών δικτύων για βελτίωση σήματος φωνής και της διαστολής σε ένα περιβάλλον Παραγωγικού Αντιπαραθετικού Δικτύου
Συγγραφέας Μπακαγιάννης, Λεωνίδας
Σύμβουλος διατριβής Στυλιανού, Ιωάννης
Μέλος κριτικής επιτροπής Τσακαλίδης, Παναγιώτης
Πανταζής, Γιάννης
Περίληψη Η Βελτίωση Σήματος Φωνής είναι ένα πεδίο της Επεξεργασίας Φωνής που στοχεύει στη βελτίωση της ποιότητας θορυβωδών σημάτων και προσπαθεί να αυξήσει την καταληπτότητά τους. Αρκετοί αλγόριθμοι προτάθηκαν για βελτίωση σήματος φωνής στον 20ο αιώνα. Οι περισσότεροι από αυτούς εκμεταλλευόντουσαν κυρίως τα φασματικά χαρακτηριστικά του θορυβώδους σήματος. Η εντατικοποίηση, ωστόσο, της χρήσης των Νευρωνικών Δικτύων (ΝΔ) τα τελευταία χρόνια, έχει οδηγήσει στην ύπαρξη αρκετών συστημάτων βασισμένων σε νευρωνικά δίκτυα που χρησιμοποιούνται για να βελτιώσουν ένα σήμα και να αφαιρέσουν το θόρυβο. Μια σχετικά πρόσφατη εξέλιξη στον τομέα των νευρωνικών δικτύων είναι τα Παραγωγικά Αντιπαραθετικά Δίκτυα (Generative Adversarial Networks-GANs), τα οποία χρησιμοποιούν δύο νευρωνικά δίκτυα,το παραγωγικό και το διαχωριστικό, σε ανταγωνισμό μεταξύ τους για να επιτύχουν τους σκοπούς του συστήματος. Τα δύο αυτά δίκτυα παίζουν ένα παίγνιο μηδενικού αθροίσματος, στο οποίο το παραγωγικό δίκτυο προσπαθεί να παράξει δείγματα που μοιάζουν αληθινά στο διαχωριστικό δίκτυο και ο απώτερος στόχος του παραγωγικού δικτύου είναι η παραγωγή δειγμάτων που το διαχωριστικό δίκτυο δεν μπορεί να ξεχωρίσει αν προκύπτουν από το παραγωγικό δίκτυο ή την πραγματική κατανομή. Σε αυτή την εργασία, τα κύρια συστήματα βελτίωσης φωνής βασισμένα σε νευρωνικά δίκτυα παρουσιάζονται μαζί με το κατά πόσο μια τεχνική που συναντάται στα νευρωνικά δίκτυα, η διαστολή, μπορεί να χρησιμοποιηθεί για να αυξήσει την αποδοτικότητα των συστημάτων βελτίωσης ποιότητας φωνής. Συγκεκριμένα, παρουσιάζεται μια συγκριτική μελέτη της αρχιτεκτονικής τριών συστημάτων βελτίωσης σήματος φωνής (SE-WaveNet, SEGAN, SE-FFTNet) και η συγκριτική τους αξιολόγηση με υποκειμενικές (μέση βαθμολογία γνώμης) και αντικειμενικές (PESQ,STOI,CSIG,CBAK,CVAL,SSNR) μετρικές. Επίσης, παρουσιάζονται τα πειράματα που έγιναν σχετικά με την εφαρμογή της διαστολής σε ένα περιβάλλον Παραγωγικού Αντιπαραθετικού Δικτύου με σκοπό τη μείωση του αριθμού των παραμέτρων σε ένα Παραγωγικό Αντιαπραθετικό Δίκτυο βελτίωσης ποιότητας φωνής .
Φυσική περιγραφή vi, 56 σ. : σχεδ., πιν., εικ. ; 30 εκ.
Γλώσσα Αγγλικά
Ημερομηνία έκδοσης 2021-03-26
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 131

Ψηφιακά τεκμήρια
No preview available

Κατέβασμα Εγγράφου
Προβολή Εγγράφου
Εμφανίσεις : 2