Your browser does not support JavaScript!

Αρχική    Συλλογές    Τύπος Εργασίας    Μεταπτυχιακές εργασίες ειδίκευσης  

Μεταπτυχιακές εργασίες ειδίκευσης

Εντολή Αναζήτησης : Συγγραφέας="Στεφανίδης"  Και Συγγραφέας="Κωνσταντίνος"

Τρέχουσα Εγγραφή: 19 από 6511

Πίσω στα Αποτελέσματα Προηγούμενη σελίδα
Επόμενη σελίδα
Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000463037
Τίτλος TeraHeap for G1 efficient caching for latency-sensitive applications
Άλλος τίτλος TeraHeap στον G1 για αποτελεσματική προσωρινή αποθήκευση σε εφαρμογές ευαίσθητες σε καθυστέρηση
Συγγραφέας Χαραλάμπους, Μαρία Χ.
Σύμβουλος διατριβής Πρατικάκης, Πολύβιος
Μέλος κριτικής επιτροπής Μπίλας, Άγγελος
Μαγκούτης, Κωνσταντίνος
Περίληψη Στα frameworks ανάλυσης μεγάλων όγκων δεδομένων, όπως το Apache Spark, χειρίζονται τον τεράστιο όγκο δεδομένων μετακινώντας αντικείμενα εκτός του διαχειριζόμενου σωρού JVM (off-heap) σε μια συσκευή γρήγορης αποθήκευσης. Ωστόσο, αυτή η στρατηγική οδηγεί σε υψηλά κόστη σειριοποίησης/αποσειριοποίησης (S/D) και συλλογής σκουπιδιών (GC), όταν τα αντικείμενα εκτός σωρού μεταφέρονται πίσω στον διαχειριζόμενο σωρό για επεξεργασία. Το TeraHeap είναι ένας μηχανισμός που καταφέρνει να εξαλείψει αυτά τα κόστη, επεκτείνοντας το JVM ώστε να χρησιμοποιεί ένα δεύτερο σωρό, υψηλής χωρητικότητας (H2) που είναι χαρτογραφημένη στη μνήμη μέσω μιας γρήγορης συσκευής αποθήκευσης και συνυπάρχει παράλληλα με τον κανονικό σωρό (H1). Το TeraHeap εξαλείφει το κόστος S/D με τη χρήση Ε/Ε με χαρτογράφηση μνήμης και μειώνει το κόστος GC, αποφεύγοντας τις σαρώσεις GC πάνω από τον δευτερεύοντα σωρό. Το TeraHeap το επιτυγχάνει αυτό (1) επισημαίνοντας υποψήφια αντικείμενα για τοποθέτηση στο Η2 και υποδεικνύοντας πότε πρέπει να μετακινηθούν, (2) εντοπίζοντας ζωντανά αντικείμενα στο Η1 που αναφέρονται από το Η2, (3) ανακτώντας νεκρά αντικείμενα του Η2 σωρού. Αρχικά, το TeraHeap υλοποιήθηκε στον Parallel Scavenge Collector, όπου επιτρέπονται μεγάλες παύσεις GC επειδή το κύριο μέλημα είναι η απόδοση της εφαρμογής. Ωστόσο, αυτό δεν αποδίδει καλά με εφαρμογές σε πραγματικού χρόνο, λόγω των μεγάλων παύσεων. Ο Garbage-First (G1) collector είναι για εφαρμογές ευαίσθητες στις καθυστερήσεις, όπου οι παύσεις GC είναι μικρές και προσπαθούν να κυμαίνονται κάτω από ένα όριο πραγματικού χρόνου, ενώ επιτυγχάνουν ταυτόχρονα υψηλή απόδοση. Σε αυτή τη διατριβή, εισαγάγαμε τον μηχανισμό TeraHeap στο G1 GC. Στόχος μας είναι να λύσουμε το πρόβλημα του μεγάλου όγκου δεδομένων, σε εφαρμογές ευαίσθητες σε καθυστέρηση που χρειάζονται γρήγορες απαντήσεις χωρίς μεγάλες παύσεις GC. Η εισαγωγή του TeraHeap στο G1 εισάγει μοναδικές προκλήσεις που δεν αντιμετωπίστηκαν στον Parallel Scavenge, τονίζοντας τις σχεδιαστικές διαφορές μεταξύ των δύο συλλεκτών. Αυτές οι προκλήσεις περιλαμβάνουν (1) ταυτόχρονο μαρκάρισμα του σωρού concurrently με τα νήματα της εφαρμογής, (2) ο G1 χρησιμοποιεί τη τεχνική evacuation αντί του compaction για τις μικρές παύσεις συλλογής του σωρού και (3) η σταδιακή συλλογή που εφαρμόζεται στην παλιά γενιά. Η αξιολόγησή μας δείχνει ότι για το ίδιο μέγεθος DRAM, το TeraHeap βελτιώνει την απόδοση έως και 72% σε σύγκριση με το εγγενές Spark. Ωστόσο, υπάρχει ακόμη περιθώριο για περαιτέρω εργασία στην εισαγωγή του μηχανισμού αυτού στο G1, δεδομένου της πολυπλοκότητας και του μη τετριμμένου χαρακτήρα του.
Φυσική περιγραφή vi,52 σ. : σχεδ., πιν., εικ. (μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Big data
GC
Garbage collection
JVM
Teraheap
Μεγάλος όγκος δεδομένων
Ημερομηνία έκδοσης 2024-03-22
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Μόνιμη Σύνδεση https://elocus.lib.uoc.gr//dlib/0/8/d/metadata-dlib-1709548157-620220-11412.tkl Bookmark and Share
Εμφανίσεις 7

Ψηφιακά τεκμήρια
No preview available

Κατέβασμα Εγγράφου
Προβολή Εγγράφου
Εμφανίσεις : 1