Περίληψη |
Η ανάπτυξη έμπειρων συστημάτων αποτελεί μία από τις μεγαλύτερες επιτυχίες του χώρου της Τεχνητής Νοημοσύνης αλλά γεννά και πολλά ερωτηματικά για τα όρια των σημερινών τεχνικών. Τα σημερινά συστήματα τεχνητής νοημοσύνης έχουν ελάχιστες ή καθόλου ικανότητες μάθησης. Λειτυργούν με βάση τη γνώση που έχουν από την αρχή χωρίς δυνατότητες αναπροσαρμογής. Ο κλάδος της Μηχανικής Μάθησης αναπτύχθηκε για την αντιμετώπιση αυτού του προβλήματος. Ο στόχος είναι η ανάπτυξη αποδοτικών συστημάτων μάθησης τα οποία θα αποτελέσουν κομμάτια των έμπειρων συστημάτων και θα επιτρέψουν την αναπροσαρμογή της γνώσης που αυτά έχουν όταν αντιμετωπίζονται άγνωστες ή ιδιόμορφες καταστάσεις. Ένα πολύ συνηθισμένο πρόβλημα για τα συστήματα μάθησης είναι η εύρεση κανόνων κατάταξης παραδειγμάτων σε κλάσεις. Μία πολύ γνωστή προσέγγιση σε αυτό το πρόβλημα είναι η επαγωγική εύρεση ενός δέντρου απόφασης. Αυτή την προσέγγιση ακολουθεί ο γνωστός, από τη βιβλιογραφία, αλγόριθμος ID3. Πρόκειται για έναν αναδρομικό αλγόριθμο ο οποίος χρησιμοποιεί μία ευριστική διαδικασία εύρεσης των πιο διαχωριστικών περιγραφών μεταξύ κλάσεων. Τα δεδομένα είναι: (1) Ένα σύνολο παραδειγμάτων με την πληροφορία της κλάσης στην οποία ανήκουν και (2) ένα σύνολο κλάσεων. Σε κάθε βήμα επιλέγεται η πιο πληροφοριακή ιδιότητα μεγιστοποιώντας μία συνάρτηση πληροφορίας. Το αποτέλεσμα είναι ένα δέντρο απόφασης στο οποίο κάθε εσωτερικός κόμβος αναπαριστά έλεγχο της τιμής μιας ιδιότητας και τα κλαδιά είναι οι δυνατές τιμές των αντίστοιχων ιδιοτήτων. Κάθε φύλλο αντιστοιχεί σε μία κλάση και κάθε μονοπάτι από τη ρίζα μέχρι κάποιο φύλλο αποτελεί έναν διαφορετικό κανόνα κατάταξης παραδειγμάτων στην αντίστοιχη κλάση. Ο αλγόριθμος δε λαμβάνει υπόψιν του ιδιομορφίες του πεδίου εφαρμογής με αποτέλεσμα να κατασκευάζονται κανόνες που αγνοούν στοιχεία που θεωρούνται σημαντικά από τους ειδικούς. Στα πλαίσια της εργασίας αυτής υλοποιήθηκε η ενίσχυση του μηχανισμού κατασκευής του δέντρου με την εισαγωγή γνώσης που αφορά τη συγκεκριμένη εφαρμογή. Αποτέλεσμα της προσπάθειας αυτής ήταν η ανάπτυξη του αλγορίθμου IDDD. Το σύστημα IDDD βασίστηκε στο σύστημα NewId που είναι μία βελτιωμένη έκδοση του ID3. Η γνώση που χρησιμοποιεί ο IDDD παίρνει την ειδική μορφή των σχέσεων εξάρτησης μεταξύ των ιδιοτήτων που περιγ΄ραφουν την εφαρμογή. Ο στόχος είναι η εξαγωγή κανόνων που υπόκεινται στους ίδιους περιορισμούς που λαμβάνουν υπόψιν οι ειδικοί ακόμα και στις περιπτώσεις που οι περιορισμοί αυτοί δεν αντανακλώνται στα δεδομένα. Στη σχέση εξάρτησης εισάγουμε τον όρο Κόρη για την ιδιότητα που εξαρτάται από κάποια άλλη και τον όρο Μάνα γι'αυτή τη δεύτερη ιδιότητα. Συγκεκριμένα ορίζεται η σχέση της απλής εξάρτησης ιδιοτήτων σύμφωνα με την οποία η επιλογή μιας ιδιότητας στις συνθήκες ενός κανόνα εξαρτάται από την επιλογή κάποιας άλλης ιδιότητας σε προηγούμενο βήμα. Επιπλέον, ορίζεται η σχέση τησς αποκλειστικής εξάρτησης η οποία καθορίζει μία συγκεκριμένη τιμή της Μάνας για την οποία απαγορύεται η επιλογή της Κόρης. Για τον IDDD απαγορεύεται η εξάρτηση μιας ιδιότητας από περισσότερες από μία ιδιότητες ενώ ο περιορισμός αυτός δεν ισχύει για τις ιδιότητες Μάνες. Μερικές φορές, ο NewId χειρίζεται ικανοποιητικά τέτοιες σχέσεις. Η διαφορά είναι ότι ο μηχανισμός που χρησιμοποιεί δεν σχετίζεται με τον τυπικό ορισμό αυτών των σχέσεων αλλά απαιτεί απότον χρήστη πολύ καλή γνώση του αλγορίθμου και μεταβολές στην αναπαράσταση των δεδομένων. Ακόμα και με τις προυποθέσεις αυτές, είναι αρκετά συχνές οι περιπτώσεις αποτυχίας σωστού χειρισμού τέτοιων σχέσεων. Όταν η τιμή της Μάνας είναι άγνωστη, ο αλγόρθμος μπορεί να οδηγηθεί στη λανθασμένη επιλογή της Κόρης. Επιπλέον όταν η Μάνα και η Κόρη έχουν την ίδια πληροφοριακή ισχύ ο NewId μπορεί να επιλέξει την Κόρη αντί της Μάνας. Το αποτέλεσμα είναι ένα σύνολο κανόνων οι οποίοι μπορεί να επιτυγχάνουν μεγάλη ακρίβεια στην κατάταξη παραδειγμάτων αλλά δεν έχουν νόημα για τους ειδικούς της εφαρμογής. Στον IDDD οι σχέσεις αυτές χρησιμοποιούνται σαν επιπλέον κριτήρια (περιορισμοί) για την επιλογή μιας ιδιότητας. Οι ιδιότητες που δεν μετέχουν σε καμία σχέση εξάρτησης δεν επηρεάζονται αλλά περιορίζεται η επιλογή ιδιοτήτων που είναι Κόρες. Ο ορισμός των σχέσεων εξάρτησης εξαρτάται και από την τύπο των ιδιοτήτων. Διακρίνουμε μεταξύ κατηγορηματκών και αριθμητικών ιδιοτήτων. Οι διαφορετικοί τύποιυπαγορεύουν ιδιαιτερότητες στην υλοποίηση των σχέσεων οι οποίες ελήφθησαν υπόψιν κατά την ανάπτυξη του IDDD. Για την αξιολόγηση της απόδοσης του IDDD χρησιμοποιήθηκαν μία συγκεκριμένη ιατρική εφαρμογή, με βάση την οποία έγινε η συγκριτική μελέτη των IDDD και NewId. Τα πειραματικά αποτελέσματα δείχνουν τη χρησιμότητα της προσέγγισης, οδηγούν σε γενικότερα συμπεράσματα για την χρήση γνώσης του πεδίου εφαρμογής σαν μέσο ενίσχυσης των επαγωγικών μηχανισμών μάθησης μέσω παραδειγμάτων και θέτουν σαφείς ερευνητικές κατευθύνσεις.
|