Περίληψη |
Η παρούσα εργασία αντιμετωπίζει το πρόβλημα του σχεδιασμού αυτόνομων πρακτόρων, δηλαδή συστημάτων τα οποία επιλέγοντας συνεχώς δράσεις σε κάποιο περιβάλλον προσπαθούν αφ εαυτού να επιτύχουν κάποιους στόχους. Τα επιθυμητά χαρακτηριστικά της επιζητούμενης προσέγγισης είναι η διαβαθμισιμότητα σε πολύπλοκα προβλήματα, η αποτελεσματικότητα με την έννοια της δυνατότητας επίδειξης επιτυχούς συμπεριφοράς ως προς τους δοθέντες στόχους και η προσαρμοστικότητα με την έννοια της αυτό-βελτίωσης με τη χρήση ενισχυτικών σημάτων αμοιβής και τιμωρίας που παρέχει το περιβάλλον στον πράκτορα. Προτείνεται μια κατανεμημένη και ιεραρχική αρχιτεκτονική επιλογής δράσεων, βασιζόμενη σε όσο το δυνατόν πιο αυτόνομα υποσυστήματα. Μέσω της συνεργασίας και του ενεργού συντονισμού των πολλαπλών ανεξάρτητων υποσυστημάτων, επιχειρείται η αντιμετώπιση σύνθετων προβλημάτων ελέγχου. Η χρήση σχήματος κατανομής ευθυνών επιτρέπει τη διάδοση της αμοιβής ή τιμωρίας που παρέχει το περιβάλλον για να μεταβληθεί η ισορροπία επιρροών των υποσυστημάτων, προκειμένου να επιτυγχάνεται η αυτο-οργάνωση του συστήματος. Για τον πειραματισμό με την προτεινόμενη αρχιτεκτονική υλοποιήθηκε ένα περιβάλλον προσομοίωσης ενός συνθετικού κόσμου διακριτών καταστάσεων. Οι σχεδιαζόμενοι πράκτορες δοκιμάστηκαν ως προς την ικανότητα επίτευξης 2 έως 4 παράλληλων και αντιφατικών στόχων σε στατικό ή σε δυναμικό περιβάλλον και την ικανότητα εξισορρόπησης διαφόρων στατικών ή δυναμικών εσωτερικών υποσυστημάτων με επιτυχή αποτελέσματα. Παράλληλα, διαφάνηκαν οι ικανότητες και οι περιορισμοί της αρχιτεκτονικής, ανάλογα με τα είδη των χρησιμοποιούμενων υποσυστημάτων, ενώ εξήχθησαν και θετικά συμπεράσματα όσον αφορά τη γενικότητα της προσέγγισης ως προς τα πιθανά είδη στόχων και την ανταπόκριση της αρχιτεκτονικής στις δυσκολίες που παρέχει ένα σύνθετο πρόβλημα. Το πεδίο εφαρμογής αυτής της εργασίας είναι η ρομποτική, αλλά το προτεινόμενο σύστημα μπορεί να εφαρμοστεί σε οποιοδήποτε πρόβλημα απαιτεί επιλογή δράσεων από αυτόνομο πράκτορα. Τέτοια προβλήματα είναι ο έλεγχος συνθετικών χαρακτήρων σε διαδραστικά συστήματα εκπαίδευσης ή διασκέδασης, ο χρονοπρογραμματισμός διαδικασιών, ο έλεγχος συσκευών, η δρομολόγηση πακέτων, οι ψηφιακοί βοηθοί κ.λ.π.
|