Your browser does not support JavaScript!

Αρχική    LAWA : locality aware partitioning for efficient query answering over RDF data  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000421162
Τίτλος LAWA : locality aware partitioning for efficient query answering over RDF data
Άλλος τίτλος Κατακερματισμός δεδομένων RDF με σκοπό την αποτελεσματική απάντηση επερωτήσεων εκμεταλλευόμενοι την τοπικότητα των δεδομένων
Συγγραφέας Αγαθάγγελος, Ιωάννης Κ.
Σύμβουλος διατριβής Πλεξουσάκης, Δημήτρης
Μέλος κριτικής επιτροπής Τζίτζικας, Ιωάννης
Στεφανίδης, Κωνσταντίνος
Περίληψη Η διόγκωση του παγκόσμιου ιστού και η αφθονία των διασυνδεδεμένων δεδομένων, απαιτούν την ανάπτυξη αποτελεσματικών μεθόδων για την διαχείριση και την αποθήκευσή τους, καθώς και την αναζήτηση σε αυτά. Το Apache Spark είναι μία από τις πιο ενεργές και δημοφιλής πλατφόρμες μεγάλων δεδομένων, και πλέον όλο και περισσότερα συστήματα το χρησιμοποιούν για αποτελεσματική απάντηση επερωτήσεων σε κατανεμημένα δεδομένα. Μέχρι τώρα, οι περισσότερες δουλειές που βασίζονται στο Spark με σκοπό την απάντηση επερωτήσεων σε RDF δεδομένα, χρησιμοποιούν απλές τεχνικές οριζόντιου ή κάθετου κατακερματισμού. Αυτές οι τεχνικές συνήθως οδηγούν σε χαμηλή απόδοση όσον αφορά τον χρόνο εκτέλεσης των επερωτήσεων, καθώς δεν καταφέρνουν να αναγνωρίσουν την τοπικότητα των δεδομένων και συνεπώς να ομαδοποιήσουν σύνολα αυτών που συνήθως επερωτώνται μαζί. Για να αντιμετωπίσουμε το πρόβλημα αυτό, σε αυτή την μεταπτυχιακή εργασία παρουσιάζουμε το LAWA , μία καινοτόμα πλατφόρμα που δέχεται σαν είσοδο ένα σύνολο δεδομένων RDF και είναι ικανή να τα κατακερματίσει αποδοτικά εξασφαλίζοντας την βέλτιστη τοπικότητα στα κατακερματισμένα μέρη. Για να το καταφέρουμε αυτό, αρχικά αναγνωρίζουμε τους πιο σημαντικούς κόμβους του συνόλου των δεδομένων σαν ”κεντρικούς κόμβους” και στην συνέχεια κατανείμουμε τους υπόλοιπους κόμβους στον ”κεντρικό κόμβο” που έχουν την μεγαλύτερη εξάρτηση. Η τεχνική αυτή εξασφαλίζει την τοπικότητα των δεδομένων και στις περισσότερες περιπτώσεις παράγει μία ομοιόμορφη κατανομή. Προκειμένου να μελετήσουμε περισσότερο τις σχεδιαστικές επιλογές απομονώνοντας τις επιπτώσεις της τοπικότητας και της κατανομής των δεδομένων, εισαγάγουμε δυο διαφορετικές τεχνικές. Η πρώτη εστιάζει στην τοπικότητα των δεδομένων (κατακερματισμός δεδομένων χρησιμοποιώντας την τοπικότητα αυτών) και η δεύτερη εγγυάται επιπλέον την ομοιόμορφη κατανομή των δεδομένων (οριοθετημένος κατακερματισμός δεδομένων χρησιμοποιώντας την τοπικότητα αυτών).Δείχνουμε ότι η προσέγγισή μας προσφέρει βέλτιστη ισορροπία μεταξύ της κατανομής των δεδομένων, του αριθμού αντιγράφων, και της μείωσης του όγκου δεδομένων που απαιτείται για την αποτίμηση επερωτήσεων, υπερτερώντας απέναντι σε υπάρχουσες προσεγγίσεις. Πιο συγκεκριμένα αξιολογήσαμε την δουλεία μας χρησιμοποιώντας συνθετικά και πραγματικά σύνολα δεδομένων, αποδεικνύοντας ότι βελτιώνουμε τον χρόνο εκτέλεσης των επερωτήσεων κατά τάξεις μεγέθους σε σύγκριση με τα μέχρι τώρα συστήματα της περιοχής.
Φυσική περιγραφή vi, 46 σ. : σχεδ., πιν., εικ.(μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Data partitioning
Distributed query processing
Ημερομηνία έκδοσης 2019-03-29
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 552

Ψηφιακά τεκμήρια
No preview available

Κατέβασμα Εγγράφου
Προβολή Εγγράφου
Εμφανίσεις : 16