Your browser does not support JavaScript!

Αρχική    Σύστημα Εξαγωγής γνώσης από κατανεμημένες και ετερογενείς βάσεις δεδομένων: Εφαρμογή σε ιατρικά πληροφοριακά συστήματα  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου uch.csd.msc//2000christofis
Τίτλος Σύστημα Εξαγωγής γνώσης από κατανεμημένες και ετερογενείς βάσεις δεδομένων: Εφαρμογή σε ιατρικά πληροφοριακά συστήματα
Άλλος τίτλος Knowledge discovery from distributed and heterogeneous databases: A clinical information systems application
Συγγραφέας Χριστοφής, Κωνσταντίνος Α
Περίληψη Με την τρέχουσα εξάπλωση των δεδομένων, το πρόβλημα εύρεσης τρόπων και μεθοδολογιών σύνδεσης κατανεμημένων και ετερογενών πηγών πληροφόρησης, γίνεται ολοένα και περισσότερο κρίσιμο. Πέρα όμως από την συλλογή των τεράστιων αυτών μεγεθών δεδομένων, είναι πολύ σημαντικό να μελετηθεί και να εξεταστεί η γενική ανάγκη σημασιολογικής ομογενοποίησης τους, καθώς και η ανακάλυψη γνώσης που πηγάζει και απορρέει από τις αντίστοιχες πηγές πληροφόρησης. Η ανάγκη αυτή αποτελεί πρόκληση για το χώρο της Μηχανικής Μάθησης και της Εξόρυξης Δεδομένων, και κατά συνέπεια όλων των ML-DM/KDD ερευνητών. Μολονότι η κατανεμημένη φύση των δεδομένων έχει λίγο έως πολύ ερμηνευτεί και κατανοηθεί, η ετερογένεια είναι μια περισσότερο πολύπλοκη έννοια. Το πραγματικό πρόβλημα που προκύπτει στο σημείο αυτό, είναι όχι μόνο πώς θα προσπελαστούν συγκεκριμένες πηγές πληροφόρησης που διατηρούν τμήματα της συνολικής πληροφορίας, αλλά πώς θα βρεθούν τρόποι καθορισμού και ευρετηριασμού της αναγκαίας μόνο πληροφορίας, σε αντιστοιχία με το σύνολο της εκεί αποθηκευμένης πληροφορίας. Μια πολλά υποσχόμενη προσέγγιση, σε αυτό το πρόβλημα ολοκλήρωσης, είναι η απόκτηση κεντρικού ελέγχου έναντι των επιμέρους οργανισμών και πληροφοριακών πηγών σε ένα επίπεδο 'μετά-δεδομένων', διατηρώντας ταυτόχρονα την αυτονομία των ατομικών συστημάτων στο επίπεδο των 'ατομικών εγγραφών δεδομένων'. Η παρούσα μεταπτυχιακή εργασία παρουσιάζει το πρόβλημα της ανακάλυψης και εξαγωγής γνώσης από κατανεμημένες και ετερογενείς ιατρικές πηγές πληροφοριών/ δεδομένων. Η βασική πρόκληση είναι 'πως οι λειτουργίες οι οποίες προέρχονται από τον χώρο του data mining και της Μηχανικής Μάθησης, υιοθετούνται και γίνονται λειτουργικές σε ένα τέτοιο κατανεμημένο και ετερογενές περιβάλλον'. Για το λόγο αυτό, προτείνεται και υλοποιείται μια πολυσύνθετη διαδικασία ολοκλήρωσης, η οποία αντιμετωπίζει θέματα όπως: (1) αποτελεσματική πρόσβαση σε κατανεμημένες και δομημένες πηγές πληροφόρησης, (2) αξιόπιστη ομογενοποίηση και ολοκλήρωση των ετερογενών δεδομένων(λαμβάνοντας υπόψη την οντολογία του πεδίου εργασίας και κάποιες ιδιαίτερα σημαντικές οντολογικές λειτουργίες), (3) επεξεργασία(statistical analysis, data mining, κ.τ.λ) των δεδομένων, και (4) παρουσίαση των αποτελεσμάτων. Αυτή η προσέγγιση ολοκλήρωσης υπαγορεύεται από τον συνδυασμό και την παρουσία πολλών τεχνολογιών και λειτουργιών. Ενδεικτικά αναφέρουμε τη χρήση CORBA τεχνολογίας για ομοιόμορφη πρόσβαση σε κατανεμημένα δεδομένα, λειτουργίες σημασιολογικής ομογενοποίησης και προηγμένες DTD/ XML διαδικασίες. Οι λειτουργίες αυτές συσχετισμένες με σύγχρονες, προχωρημένες και αποτελεσματικές αναπαραστάσεις μοντέλων, διαμορφώνουν και προσδιορίζουν ένα σκελετό και ένα περιβάλλον, στο οποίο μπορούν να εκπονηθούν πλέον έξυπνα και αποτελεσματικά όλες οι απαιτούμενες και αναγκαίες KDD διεργασίες. Η βασική συνεισφορά της εργασίας μας είναι η συνεργασία και η τροποποίηση όλων των KDD/ARM λειτουργιών, ώστε να είναι απόλυτα εφαρμόσιμες στα παραγόμενα XML έγγραφα. Συγκεκριμένα, επικεντρωνόμαστε και αντιμετωπίζουμε το πρόβλημα παραγωγής ενδιαφερόντων συσχετίσεων μεταξύ των δεδομένων που είναι αποθηκευμένα σε κατανεμημένα και ετερογενή ιατρικά πληροφοριακά συστήματα. Το περιβάλλον εφαρμογής της προσέγγισης μας είναι το HYGEIAnet: The Integrated Health Care Network of Crete. Η παρούσα εργασία επεκτείνει την αρχιτεκτονική αναφοράς του HYGEIAnet προσθέτοντας: (α) λειτουργίες σημασιολογικής ομογενοποίησης, (β) τη διαδικασία δημιουργίας των DTD/XML εγγράφων, υποδεικνύοντας τον τρόπο αναπαράστασης της αποθηκευμένης πληροφορίας, (γ) αντικειμενοστραφή σχήματα δόμησης των δεδομένων και επιτελούμενες λειτουργίες σε αυτά και (δ) την υιοθέτηση των KDD λειτουργιών- υλοποιημένες από έναν εξειδικευμένο(Associations Rule Mining) αλγόριθμο- ονομαζόμενο AprioriXML. Βασισμένοι στην πρόβλεψη ότι οι μελλοντικές βάσεις θα χρησιμοποιούν XML-like αναπαραστάσεις και μορφές δεδομένων, προκειμένου να αποθηκεύεται και να εκμαιεύεται η προς επεξεργασία πληροφορία, η εργασία μας παρουσιάζει μια υποσχόμενη αρχιτεκτονική και ένα περιβάλλον εργασίας κινούμενο προς αυτήν ακριβώς την κατεύθυνση.
Ημερομηνία έκδοσης 2000-07-01
Ημερομηνία διάθεσης 2000-07-26
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 123

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου

No preview available

Προβολή Εγγράφου
Εμφανίσεις : 1