Your browser does not support JavaScript!

Αρχική    A scalable data science platform built on open source technologies with application of predictive analytics on acute Respiratory Distress Syndrome disease  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000438712
Τίτλος A scalable data science platform built on open source technologies with application of predictive analytics on acute Respiratory Distress Syndrome disease
Άλλος τίτλος Μια επεκτάσιμη πλατφόρμα επιστήμης δεδομένων, βασισμένη σε τεχνολογίες ανοιχτού κώδικα με εφαρμογή προγνωστικής ανάλυσης για τη νόσο του Συνδρόμου Οξείας Αναπνευστικής Δυσχέρειας
Συγγραφέας Χανιωτάκης, Ευάγγελος
Σύμβουλος διατριβής Πλεξουσάκης, Δημήτρης
Μέλος κριτικής επιτροπής Τσικνάκης, Μανώλης
Μαγκούτης, Κώστας
Περίληψη Η συνεχής ανάπτυξη μεγάλου όγκου βιοϊατρικών δεδομένων στην υγειονομική περίθαλψη δημιουργεί σημαντικές προκλήσεις για την αποτελεσματική τους διαχείριση. Αυτή η ανάγκη έκανε αναπόφευκτη την υιοθέτηση μεγάλων υποδομών δεδομένων και σχετικών τεχνικών από οργανισμούς υγειονομικής περίθαλψης, προκειμένου να εξερευνήσουν αποτελεσματικά τον πλούτο των δεδομένων του πραγματικού κόσμου που δημιουργούνται με στόχο τη βελτίωση της ποιότητας των υπηρεσιών υγείας. Στη βιομηχανία υγειονομικής περίθαλψης, υπάρχουν διάφορες μεγάλες πηγές δεδομένων, που χαρακτηρίζονται από ετερογένεια. Αυτές περιλαμβάνουν νοσοκομειακά συστήματα πληροφοριών (HIS) και ιατρικά αρχεία ασθενών (EHRs), αποτελέσματα εργαστηριακών διαδικασιών και εξετάσεων που βρίσκονται σε σχετικά συστήματα πληροφοριών (Laboratory Information Systems - LIS), δεδομένα από συνεχή παρακολούθηση ασθενών (π.χ. σε μία μονάδα εντατικής θεραπείας - ΜΕΘ) και δεδομένα από έξυπνες συσκευές, όπως φορητά. Επίσης, πολύ μεγάλα σύνολα δεδομένων δημιουργούνται από κλινικές και ερευνητικές εργασίες που σχετίζονται με τη γονιδιωματική. Όσον αφορά τη γονιδιωματική, ο ρυθμός ανάπτυξης κατά την τελευταία δεκαετία ήταν επίσης πραγματικά εκπληκτικός, με τον συνολικό αριθμό δεδομένων αλληλούχισης που παράγονται να διπλασιάζεται περίπου κάθε επτά μήνες. Αυτά τα δεδομένα απαιτούν αποτελεσματική διαχείριση και ανάλυση προκειμένου να εξάγουν ουσιαστικές και εφαρμόσιμες πληροφορίες. Κατά την ανάπτυξη τέτοιων λύσεων πρέπει να αντιμετωπιστεί μια σειρά από προκλήσεις και επιπλοκές που συνδέονται με κάθε βήμα του σχεδιασμού συστημάτων για την διαχείριση τέτοιων μεγάλων συνόλων δεδομένων υγειονομικής περίθαλψης. Αυτές μπορούν να επιλυθούν μόνο χρησιμοποιώντας υψηλής ποιότητας υπολογιστικές λύσεις για ανάλυση μεγάλων δεδομένων. Ειδικά στην τρέχουσα κατάσταση της πανδημίας COVID-19, οι επιπλοκές που μπορεί να εμφανιστούν μετά την έναρξη αυτής της ασθένειας στη ζωή του ανθρώπου είναι πραγματικά σημαντικές. Μια σημαντική τέτοια επιπλοκή είναι το σύνδρομο οξείας αναπνευστικής δυσχέρειας (ARDS), το οποίο είναι μια σοβαρή αναπνευστική κατάσταση με υψηλή θνησιμότητα και σχετική νοσηρότητα. Ένας μεγάλος αριθμός βασικών και κλινικών μελετών έχουν δείξει ότι η έγκαιρη διάγνωση και παρέμβαση είναι καθοριστικής σημασίας για τη βελτίωση του ποσοστού επιβίωσης των ασθενών με ARDS. Επομένως, υπάρχει επιτακτική ανάγκη για την ανάπτυξη και κλινική δοκιμή προγνωστικών μοντέλων για συμβάντα ARDS, τα οποία θα μπορούσαν να βελτιώσουν την κλινική διάγνωση ή τη διαχείριση του ARDS. Στην παρούσα διατριβή, εστιάσαμε σε δύο διαφορετικούς στόχους: συγκεκριμένα α) να σχεδιάσουμε μια επεκτάσιμη πλατφόρμα διαχείρισης μεγάλου όγκου δεδομένων, βασισμένοι σε τεχνολογίες ανοιχτού κώδικα, και β) να εκμεταλλευτούμε την πλατφόρμα και δημόσια διαθέσιμα μεγάλα σύνολα κλινικών δεδομένων προκειμένου να αναπτύξουμε μοντέλα μηχανικής μάθησης για την πρόβλεψη συμβάντων οξείας αναπνευστικής δυσχέρειας (ARDS) μέσω κοινώς διαθέσιμων παραμέτρων, συμπεριλαμβανομένων των βασικών χαρακτηριστικών και των κλινικών και εργαστηριακών παραμέτρων. Η διατριβή χωρίζεται σε δύο κύρια μέρη. Το πρώτο μέρος παρουσιάζει και αναλύει λεπτομερώς όλες τις διαδικασίες, τα υλικά και τις μεθόδους που υιοθετήθηκαν για την ανάπτυξη αυτής της πλατφόρμας διαχείρισης μεγάλων δεδομένων. Εστιάσαμε στις επιπλοκές και τις δυσκολίες που προκύπτουν κατά τη δημιουργία και τη χρήση τέτοιων συστημάτων σε μεγάλα βιοϊατρικά δεδομένα, όπως το σύνολο δεδομένων MIMIC-III. Το δεύτερο μέρος αυτής της διατριβής, περιγράφει τον τρόπο με τον οποίο χειριστήκαμε αυτήν την κλινική βάση δεδομένων, για να πραγματοποιήσουμε μια μελέτη αξιολόγησης της πλατφόρμας μας, σε ένα πραγματικό κλινικό σενάριο για το ARDS. Ο στόχος της μελέτης μας ήταν να αναπτύξουμε και να αξιολογήσουμε μια νέα εφαρμογή αλγοριθμικών μοντέλων, Random Forest και Logistic Regression, που εκπαιδεύτηκαν σε δεδομένα σχετικά με την υγεία των ασθενών, για την πρώιμη διάγνωση και πρόβλεψη του ARDS. Η προσέγγιση μας επιτυγχάνει καλύτερα αποτελέσματα σε όλες τις μετρήσεις, σε σύγκριση με σχετικές δημοσιευμένες προσπάθειες που επίσης χρησιμοποιούν τη βάση δεδομένων MIMIC III για την ανάπτυξη προγνωστικών μοντέλων για ARDS. Συγκεκριμένα, και τα δύο αλγοριθμικά μοντέλα μας έχουν καλύτερη απόδοση στην πρόβλεψη ARDS, με κυρίαρχο το Random Forest με 10-fold cross validation, σύμφωνα με την περιοχή κάτω από την καμπύλη AUC (95,1%), την ακρίβεια (98,0%), την ειδικότητα (98,62%) και την ευαισθησία (96,25%).
Φυσική περιγραφή v, 63 σ. : σχεδ., πιν., εικ. ; 30 εκ.
Γλώσσα Αγγλικά
Ημερομηνία έκδοσης 2021-03-26
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 175

Ψηφιακά τεκμήρια
No preview available

Δεν έχετε δικαιώματα για να δείτε το έγγραφο.
Δεν θα είναι διαθέσιμο έως: 2023-03-26