Your browser does not support JavaScript!

Αρχική    Data quality metrics in RDF based RDMSs  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000337668
Τίτλος Data quality metrics in RDF based RDMSs
Άλλος τίτλος Μετρικές Ποιότητας Δεδομένων σε Δυομότιμα Συστήματα Διαχείρισης Δεδομένων βασισμένα στην RDF
Συγγραφέας Κίτσου, Γεωργία Γεώργιος
Σύμβουλος διατριβής Χριστοφίδης, Βασίλης
Περίληψη Τον τελευταίο καιρό, οι επιστημονικές ή εκπαιδευτικές κοινότητες αναζητούν υποδομές με μεγάλο βαθμό αυτονομίας που θα τους δίνουν τη δυνατότητα να ανταλλάσσουν και να ενσωματώνουν (ημι)δομημένα δεδομένα αποθηκευμένα σε ομότιμους κόμβους. Σε αυτό το πλαίσιο, υπάρχει η ανάγκη για Δυομότιμα Συστήματα Διαχείρισης Δεδομένων, ικανά να υποστηρίζουν μερικώς συνδεδεμένες κοινότητες βάσεων δεδομένων, στις οποίες κάθε ομότιμος κόμβος μπορεί να συνδέεται και να εγκαταλείπει το δίκτυο κατά βούληση, ενώ ομάδες κόμβων συνεργάζονται για να παρέχουν προηγμένες υπηρεσίες διαχείρισης δεδομένων σε πολύ μεγάλη κλίμακα.
Στο δικό μας πλαίσιο, θεωρούμε ότι οι ομότιμοι κόμβοι δημοσιοποιούν τις τοπικές τους βάσεις χρησιμοποιώντας τμήματα από RDF/S σχήματα. Η δημοσιοποίηση καθορίζεται από κατάλληλες RDF/S όψεις, που ονομάζονται RVL όψεις. Σε αυτό το επίπεδο, λόγω της έντονα κατανεμημένης φύσης ενός Δυομότιμου Συστήματος Διαχείρισης Δεδομένων, χρειαζόμαστε μια αποτελεσματική υπηρεσία αναζήτησης για την αναγνώριση με κατανεμημένο τρόπο των όψεων ομότιμων κόμβων που μπορούν πλήρως ή μερικώς να συνεισφέρουν στην απάντηση ενός συγκεκριμένου ερωτήματος. Επιπρόσθετα, λόγω του πολύ μεγάλου αριθμού κόμβων σε ένα Δυομότιμο Σύστημα Διαχείρισης Δεδομένων οι οποίοι μπορούν να συνεισφέρουν στην απάντηση ενός ερωτήματος, ένας διαστρωματωμένος τρόπος δρομολόγησης και δημιουργίας πλάνων επερωτήσεων είναι απαραίτητος, ώστε να μπορούν να ανακτηθούν όσο το δυνατό συντομότερα οι πρώτες απαντήσεις από τους πιο σχετικούς κόμβους, καθώς γίνεται η επεξεργασία του ερωτήματος από άλλους.
Παρόλα αυτά, καθώς ο αριθμός των κόμβων ενός Δυομότιμου Συστήματος Διαχείρισης Δεδομένων αυξάνεται και τα ερωτήματα γίνονται πιο πολύπλοκα, ο αριθμός των παραγόμενων πλάνων που χρειάζεται να βελτιστοποιηθούν γίνεται τεράστιος. Οι περισσότερες προηγούμενες εργασίες έχουν θεωρήσει τον περιορισμό του χώρου των πλάνων είτε σε σχέση με ένα μοντέλο κόστους, είτε σε σχέση με μια μετρική ποιότητας. Όμως ο περιορισμός του χώρου τον πλάνων μπορεί να είναι ακόμα πιο αποτελεσματικός αν θεωρήσουμε την ταυτόχρονη χρήση μετρικών κόστους και ποιότητας. Ένα κατώφλι το οποίο συνδυάζει μετρικές κόστους και ποιότητας μπορεί να τεθεί από το χρήστη ή το σύστημα.
Σε αυτή την εργασία παρέχουμε μετρικές για την εκτίμηση της ποιότητας των δεδομένων, όπως η κάλυψη, η πυκνότητα και η πληρότητα των δεδομένων ενός ομότιμου κόμβου σε σχέση με το συνολικά διαθέσιμο πλήθος δεδομένων. Οι ίδιες μετρικές μπορούν να χρησιμοποιηθούν για τη μέτρηση της ποιότητας των πλάνων επερωτήσεων που παράγονται από το βελτιστοποιητή του Δυομότιμου Συστήματος Διαχείρισης Δεδομένων. Κατά τη διαδικασία της εκτίμησης αυτών των μετρικών, η έννοια της επικάλυψης των δεδομένων δύο ή περισσότερων κόμβων είναι σημαντική.
Επιπλέον, εισάγουμε φόρμουλες για την εκτίμηση της πληθικότητας για τους δύο σημαντικότερους τελεστές στο πλαίσιό μας, τον τελεστή της ένωσης και τον τελεστή της σύζευξης και παρουσιάζουμε μια παραλλαγή ενός μοντέλου κόστους βασισμένου στο χρόνο απόκρισης των πλάνων. Τέλος, εμπλουτίζουμε με τις μετρικές ποιότητας που ορίζουμε υπάρχοντες αλγορίθμους κατασκευής πλάνων που έχουν προταθεί για Δυομότιμα Συστήματα Διαχείρισης Δεδομένων βασισμένα στην RDF. Στόχος μας είναι η απόρριψη πλάνων τα οποία κατατάσσονται κάτω από ένα καθορισμένο κατώφλι που συνδυάζει μετρικές κόστους και ποιότητας και η μείωση του χρόνου κατασκευής ερωτημάτων όσο το δυνατό περισσότερο, διασφαλίζοντας ταυτόχρονα ότι το τελικό πλάνο εκτέλεσης θα είναι το καλύτερο δυνατό με βάση το κατώφλι που τέθηκε.
Φυσική περιγραφή 130 σ. : εικ. ; 30 cm.
Γλώσσα Αγγλικά
Ημερομηνία έκδοσης 2008-12-04
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 139

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 3