Abstract |
Τα τελευταία χρόνια, τα συστήματα εκφώνησης κειμένου από Η/Υ (Text-To-Speech) έχουν αρχίσει να εμφανίζονται σαν συνηθισμένο κομμάτι ολοκληρωμένων περιβαλλόντων (MS-Windows, Macintosh). Μερικές από τις εφαρμογές των συστημάτων TTS είναι η παροχή υπηρεσιών μέσω τηλεφώνου (e-mail, telex), η παροχή βοήθειας σε άτομα με προβλήματα στην όραση ή την ομιλία, η ακουστική προσπέλαση βάσεων κειμένου και εκφώνηση οδηγιών. Τα υπάρχοντα συστήματα TTS στηρίζονται στη μοντελοποίηση του ανθρώπινου συστήματος παραγωγής φωνής ή στη μοντελοποίηση του σήματος φωνής. Στη δεύτερη κατηγορία ανήκουν και τα συστήματα που συνθέτουν φωνή συρράπτοντας στοιχειώδη κομμάτια της (πχ φθόγγους, συλλαβές) που ονομάζονται φωνητικές μονάδες. Στα πλαίσια αυτής της εργασίας κατασκευάστηκε ένα σύστημα TTS για την ελληνική γλώσσα βασισμένο στη τεχνική συρραφής φωνητικών μονάδων. Οι φωνητικές μονάδες στο σύστημα μας ονομάστηκαν διασυλλαβές και ορίζονται σαν το τμήμα φωνής από το μέσο ενός φωνήεντος μέχρι το μέσο του επόμενου. Η επιλογή αυτή έχει άμεση σχέση με τα χαρακτηριστικά της ελληνικής γλώσσας η οποία περιέχει πολλά και καθαρά στη προφορά φωνήεντα. Έτσι η συρραφή γίνεται πάντα μεταξύ φωνηέντων γι' αυτό και οι ασυνέχειες που πρέπει να εξομαλυνθούν δεν απαιτούν μεγάλη επεξεργασία. Στο σύστημα ελέγχεται η προσωδία της φωνής (τονικότητα, διάρκεια, ένταση) για την έκφραση οριστικών και ερωτηματικών προτάσεων αλλά και την φυσικότερη έκφραση της ομιλίας. Επίσης περιγράφεται και υλοποιείται ένας συστηματικός τρόπος κατασκευής της βάσης διασυλλαβών για την σύνθεση των ελληνικών λέξεων.
|