|
Κωδικός Πόρου |
000413373 |
Τίτλος |
A big data analytics system based on a high level query language using Apache Spark |
Άλλος τίτλος |
Ένα σύστημα ανάλυσης μεγάλων δεδομένων βασισμένο σε μία γλώσσα επερωτήσεων υψηλού επιπέδου χρησιμοποιώντας το Apache Spark |
Συγγραφέας
|
Γλαμπεδάκης, Βασίλειος Γ.
|
Σύμβουλος διατριβής
|
Πλεξουσάκης, Δημήτρης
|
Μέλος κριτικής επιτροπής
|
Σπυράτος, Νικόλας
Τζίτζικας, Γιάννης
|
Περίληψη |
Η ανάλυση μεγάλων δεδομένων είναι μία από τις πιο ενεργές ερευνητικές περιοχές σήμερα και
συνοδεύεται από πολλές θεωρητικές και πρακτικές προκλήσεις. Αυτή η εργασία συμβάλλει σε
αυτήν την περιοχή υλοποιώντας την γλώσσα
HIFUN
χρησιμοποιώντας το
framework
Apache
Spark. Η
HIFUN
είναι μία γλώσσα επερωτήσεων υψηλού επιπέδου η οποία έχει προταθεί για την
έκφραση επερωτήσεων ανάλυσης πάνω σε δεδομένα μεγάλου όγκου. Αυτή η γλώσσα κάνει έναν
σαφή διαχωρισμό μεταξύ του εννοιολογικού και του φυσικού επιπέδου. Μία επερώτηση
ανάλυσης και η απάντησή της ορίζονται στο εννοιολογικό επίπεδο ανεξάρτητα από την φύση και
την τοποθεσία των δεδομένων. Κατόπιν, αυτοί οι αφηρημένοι ορισμοί αντιστοιχίζονται σε
μηχανισμούς αποτίμησης χαμηλότερου επιπέδου, λαμβάνοντας υπόψιν την φύση
και την τοποθεσία των δεδομένων, όπως επίσης και άλλους σχετιζόμενους παράγοντες. Σε αυτήν την
εργασία, αξιοποιούμε αυτήν την γλώσσα για την σχεδίαση και την υλοποίηση ενός συστήματος
το οποίο επιτρέπει σε έναν χρήστη να αναλύσει, να οπτικοποιήσει και να ανακαλύψει
πληροφορία η οποία μπορεί να είναι χρήσιμη στη λήψη αποφάσεων και η οποία είναι κρυμμένη
σε δεδομένα μεγάλου όγκου. Στο φυσικό επίπεδο, οι επερωτήσεις της
HIFUN
αντιστοιχίζονται σε
μηχανισμούς αποτίμησης χαμηλότερου επιπέδου του
Apache
Spark, ακολουθώντας το
προτεινόμενο από την
HIFUN
εννοιολογικό πλάνο αποτίμησης, υποστηρίζοντας μία μεγάλη
γκάμα μορφών δεδομένων. Στο εννοιολογικό επίπεδο, εφαρμόζουμε τους κανόνες
επανεγγραφής επερωτήσεων και δημιουργούμε πλάνα εκτέλεσης επερωτήσεων, προτεινόμενα
από την HIFUN. Η εργασία αυτή δείχνει ότι το τυπικό μοντέλο της HIFUN
είναι χρήσιμο στην πράξη και η πειραματική αξιολόγησή του συστήματος αποδεικνύει ότι η προσέγγιση του
μοντέλου στην επανεγγραφή την επερωτήσεων και στην παραγωγή πλάνων εκτέλεσης
επερωτήσεων επιτυγχάνει τη μείωση του υπολογιστικού κόστους ανεξάρτητα από την φύση των
δεδομένων.
|
Φυσική περιγραφή |
iv, 57 σ. : σχεδ., πιν., εικ. ; 30 εκ. |
Γλώσσα |
Αγγλικά |
Θέμα |
Analytic queries |
|
Conceptual modeling |
|
Query languages |
|
Ανάλυση μεγάλων δεδομένων |
|
Γλώσσες επερωτήσεων |
|
Εννοιολογική μοντελοποίηση |
|
Επερωτήσεις ανάλυσης |
Ημερομηνία έκδοσης |
2017-11-24 |
Συλλογή
|
Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
|
|
Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
|
Εμφανίσεις |
982 |