
Αρχική
Data quality metrics in RDF based RDMSs
Αποτελέσματα - Λεπτομέρειες
|
||||
Κωδικός Πόρου | 000337668 | |||
Τίτλος | Data quality metrics in RDF based RDMSs | |||
Άλλος τίτλος | Μετρικές Ποιότητας Δεδομένων σε Δυομότιμα Συστήματα Διαχείρισης Δεδομένων βασισμένα στην RDF | |||
Συγγραφέας | Κίτσου, Γεωργία Γεώργιος | |||
Σύμβουλος διατριβής | Χριστοφίδης, Βασίλης | |||
Περίληψη |
Στο δικό μας πλαίσιο, θεωρούμε ότι οι ομότιμοι κόμβοι δημοσιοποιούν τις τοπικές τους βάσεις χρησιμοποιώντας τμήματα από RDF/S σχήματα. Η δημοσιοποίηση καθορίζεται από κατάλληλες RDF/S όψεις, που ονομάζονται RVL όψεις. Σε αυτό το επίπεδο, λόγω της έντονα κατανεμημένης φύσης ενός Δυομότιμου Συστήματος Διαχείρισης Δεδομένων, χρειαζόμαστε μια αποτελεσματική υπηρεσία αναζήτησης για την αναγνώριση με κατανεμημένο τρόπο των όψεων ομότιμων κόμβων που μπορούν πλήρως ή μερικώς να συνεισφέρουν στην απάντηση ενός συγκεκριμένου ερωτήματος. Επιπρόσθετα, λόγω του πολύ μεγάλου αριθμού κόμβων σε ένα Δυομότιμο Σύστημα Διαχείρισης Δεδομένων οι οποίοι μπορούν να συνεισφέρουν στην απάντηση ενός ερωτήματος, ένας διαστρωματωμένος τρόπος δρομολόγησης και δημιουργίας πλάνων επερωτήσεων είναι απαραίτητος, ώστε να μπορούν να ανακτηθούν όσο το δυνατό συντομότερα οι πρώτες απαντήσεις από τους πιο σχετικούς κόμβους, καθώς γίνεται η επεξεργασία του ερωτήματος από άλλους. Παρόλα αυτά, καθώς ο αριθμός των κόμβων ενός Δυομότιμου Συστήματος Διαχείρισης Δεδομένων αυξάνεται και τα ερωτήματα γίνονται πιο πολύπλοκα, ο αριθμός των παραγόμενων πλάνων που χρειάζεται να βελτιστοποιηθούν γίνεται τεράστιος. Οι περισσότερες προηγούμενες εργασίες έχουν θεωρήσει τον περιορισμό του χώρου των πλάνων είτε σε σχέση με ένα μοντέλο κόστους, είτε σε σχέση με μια μετρική ποιότητας. Όμως ο περιορισμός του χώρου τον πλάνων μπορεί να είναι ακόμα πιο αποτελεσματικός αν θεωρήσουμε την ταυτόχρονη χρήση μετρικών κόστους και ποιότητας. Ένα κατώφλι το οποίο συνδυάζει μετρικές κόστους και ποιότητας μπορεί να τεθεί από το χρήστη ή το σύστημα. Σε αυτή την εργασία παρέχουμε μετρικές για την εκτίμηση της ποιότητας των δεδομένων, όπως η κάλυψη, η πυκνότητα και η πληρότητα των δεδομένων ενός ομότιμου κόμβου σε σχέση με το συνολικά διαθέσιμο πλήθος δεδομένων. Οι ίδιες μετρικές μπορούν να χρησιμοποιηθούν για τη μέτρηση της ποιότητας των πλάνων επερωτήσεων που παράγονται από το βελτιστοποιητή του Δυομότιμου Συστήματος Διαχείρισης Δεδομένων. Κατά τη διαδικασία της εκτίμησης αυτών των μετρικών, η έννοια της επικάλυψης των δεδομένων δύο ή περισσότερων κόμβων είναι σημαντική. Επιπλέον, εισάγουμε φόρμουλες για την εκτίμηση της πληθικότητας για τους δύο σημαντικότερους τελεστές στο πλαίσιό μας, τον τελεστή της ένωσης και τον τελεστή της σύζευξης και παρουσιάζουμε μια παραλλαγή ενός μοντέλου κόστους βασισμένου στο χρόνο απόκρισης των πλάνων. Τέλος, εμπλουτίζουμε με τις μετρικές ποιότητας που ορίζουμε υπάρχοντες αλγορίθμους κατασκευής πλάνων που έχουν προταθεί για Δυομότιμα Συστήματα Διαχείρισης Δεδομένων βασισμένα στην RDF. Στόχος μας είναι η απόρριψη πλάνων τα οποία κατατάσσονται κάτω από ένα καθορισμένο κατώφλι που συνδυάζει μετρικές κόστους και ποιότητας και η μείωση του χρόνου κατασκευής ερωτημάτων όσο το δυνατό περισσότερο, διασφαλίζοντας ταυτόχρονα ότι το τελικό πλάνο εκτέλεσης θα είναι το καλύτερο δυνατό με βάση το κατώφλι που τέθηκε. |
|||
Φυσική περιγραφή | 130 σ. : εικ. ; 30 cm. | |||
Γλώσσα | Αγγλικά | |||
Ημερομηνία έκδοσης | 2008-12-04 | |||
Συλλογή | Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης | |||
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης | ||||
Εμφανίσεις | 314 |
Ψηφιακά τεκμήρια | |
---|---|
![]() |
Κατέβασμα Εγγράφου |