Περίληψη |
Σύμφωνα με τον Παγκόσμιο Οργανισμό Υγείας, ο καρκίνος του πνεύμονα αποτελεί τη μορφή
καρκίνου με το υψηλότερο ποσοστό θνησιμότητας παγκοσμίως. Ο καρκίνος του πνεύμονα χωρίζεται
σε δύο κατηγορίες, μη-μικροκυτταρικό και μικροκυτταρικό καρκίνο του πνεύμονα, με την πρώτη
κατηγορία να κυριαρχεί με ποσοστό 85% των διαγνώσεων καρκίνου του πνεύμονα. Στην πλειοψηφία
των ασθενών, η διάγνωση γίνεται μετά την εμφάνιση συμπτωμάτων που σχετίζονται με πρωταρχική
ή μεταστατική ασθένεια. Η εξέλιξη της πάθησης χαρακτηρίζεται από πέντε στάδια, από 0 έως IV. Η
άμεση διάγνωση και ανάλυση της ασθένειας είναι απαραίτητη για την επιλογή της κατάλληλης
θεραπείας. Αρκετές μελέτες συσχετίζουν χαρακτηριστικά που προκύπτουν από ιατρικές εικόνες με
τον καρκίνο του πνεύμονα. Η ραδιωμική (radiomics) αφορά στην εξαγωγή μεγάλου αριθμού
χαρακτηριστικών από ιατρικές εικόνες με σκοπό τη δημιουργία βάσεων δεδομένων από δεδομένα
απεικονιστικών μεθόδων. Τα χαρακτηριστικά της εικόνας μπορούν να χρησιμοποιηθούν για την
εύρεση διαγνωστικών και προγνωστικών συσχετισμών σε ασθενείς με καρκίνο του πνεύμονα. Η
διαθεσιμότητα δεδομένων ιατρικής εικόνας σε συνδυασμό με την αύξηση μεθόδων βαθιάς μάθησης
(deep learning) άνοιξε το δρόμο για την εξαγωγή χαρακτηριστικών υψηλής ποιότητας που θα
μπορούσαν να συμβάλλουν στην βαθύτερη κατανόηση της ασθένειας. Επιπλέον, η
μεταγραφωματική (transcriptomics) παρέχει σημαντικές πληροφορίες για το γονιδίωμα, βοηθώντας
στην κατανόηση των μηχανισμών πίσω από τις βιολογικές διεργασίες του καρκίνου.
Αρκετές μελέτες που σχετίζονται με τον καρκίνο στοχεύουν στην εύρεση του χρόνου μέχρι να
εμφανιστεί το συμβάν του ενδιαφέροντος. Το συμβάν μπορεί να είναι ο θάνατος του ασθενούς ή η
επανεμφάνιση της νόσου ύστερα από μία επιτυχή θεραπεία. Η μοντελοποίηση των δεδομένων
χρόνου μέχρι την εμφάνιση του συμβάντος ονομάζεται ανάλυση επιβίωσης (survival analysis) και
βρίσκει εφαρμογή στην βιοϊατρική, τη βιοστατιστική, καθώς και σε άλλες επιστήμες, όπως στη
μηχανική. Αρκετές μελέτες χρησιμοποιούν δεδομένα από μία μόνο πηγή, όπως ιστολογικά δεδομένα,
απεικονιστικά ή μοριακά, για την ανάλυση επιβίωσης ασθενών με καρκίνο.
Σκοπός της μεταπτυχιακής εργασίας είναι η ανάλυση επιβίωσης με χρήση μεθόδων μηχανικής
μάθησης και χρησιμοποιώντας διαφορετικές πηγές δεδομένων, ραδιωμικής, μεταγραφωματικής και
δεδομένων που προέκυψαν από την εφαρμογή μοντέλων βαθιάς μάθησης σε ιατρικές εικόνες (deep
features). Το σύνολο των δεδομένων που χρησιμοποιήθηκε περιείχε 211 εικόνες αξονικής
τομογραφίας, 130 φορείς RNA-seq και κλινικά δεδομένα με πληροφορίες ιστολογίας, γονιδιώματος,
επιβίωσης και υποτροπής της νόσου. Από αυτά τα δεδομένα, ένα υποσύνολο με 40 ασθενείς
χρησιμοποιήθηκε για την ανάλυση επιβίωσης. Δύο μέθοδοι μηχανικής μάθησης έχουν χρησιμοποιηθεί ευρέως για την ταξινόμηση ασθενών σε
περιπτώσεις υψηλού και χαμηλού κινδύνου, ο αλγόριθμος τυχαίων δασών (random forest) και οι
μηχανές διανυσμάτων υποστήριξης (support vector machines). Δύο συνδυασμοί δεδομένων
μελετήθηκαν, ο συνδυασμός όλων των δεδομένων (deep radiotranscriptomics) και ο συνδυασμός
μόνο δεδομένων radiomics και deep features. Η προτεινόμενη ανάλυση με συνδυασμό όλων των
δεδομένων, deep ratiotranscriptomics, οδήγησε σε C-index 0.77 ± 0.10 με μηχανές διανυσμάτων
υποστήριξης και 0.74 ± 0.11, με τυχαία δάση. Με συνδυασμό μόνο των δεδομένων radiomics και
deep features, οι μηχανές διανυσμάτων υποστήριξης κατέληξαν σε C-index 0.73 ± 0.07 και τα τυχαία
δάση σε C-index 0.68 ± 0.03. Ο συνδυασμός όλων των χαρακτηριστικών οδήγησε σε μοντέλα με
καλύτερη ικανότητα πρόβλεψης. Τα μοντέλα βαθιάς μάθησης που παρείχαν χαρακτηριστικά υψηλής
ποιότητας ήταν τα MobileNet, ResNet, DenseNet και NasNet. Η μελέτη αυτή οδήγησε στο
συμπέρασμα ότι η χρήση δεδομένων από διαφορετικές πηγές οδηγεί σε μοντέλα με καλύτερη
πρόβλεψη της επικινδυνότητας της νόσου των ασθενών και σε καλύτερη κατηγοριοποίησή τους σε
ασθενείς χαμηλού και υψηλού κινδύνου.
Τμήματα αυτής της εργασίας περιλαμβάνονται στη δημοσίευση με τίτλο
“Deep Radiotranscriptomics of Non-Small Cell Lung Carcinoma for Assessing High-Level Clinical
Outcomes using Multi-View Analysis” από τους Τριβιζάκης Ελευθέριος, Κουτρούμπα Νικολέττα
Μαρία, Σουγκλάκος Ιωάννης, Καραντάνας Απόστολος, Ζερβάκης Μιχάλης Ε., Μαριάς Κώστας, η
οποία βρίσκεται σε στάδιο αξιολόγησης για αποστολή σε επιστημονικό περιοδικό. Λεπτομέρειες
σχετικά με παραμέτρους που επιλέχθηκαν και ο κώδικας για την ανάλυση είναι διαθέσιμα
διαδικτυακά στο: https://github.com/NikiKou/deep_radiotranscriptomics_survival_analysis.
|