Your browser does not support JavaScript!

Αρχική    Latent feature construction for gene expressions improves predictions  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000412226
Τίτλος Latent feature construction for gene expressions improves predictions
Άλλος τίτλος Η κατασκευή κρυμμένων χαρακτηριστικών για γονιδιακές εκφράσεις βελτιώνει την προβλεπτική ικανότητα
Συγγραφέας Τσέλας, Χρήστος Ρ.
Σύμβουλος διατριβής Τσαμαρδινός, Ιωάννης
Μέλος κριτικής επιτροπής Τζιρίτας, Γεώργιος
Στυλιανού, Ιωάννης
Περίληψη Η ανάλυση γονιδιακών εκφράσεων στοχεύει στη βελτίωση της κατανόησης των ενδογενών κυτταρικών διεργασιών και συμβάλλει στην επιτυχή εφαρμογή της εξατομικευμένης ιατρικής. Η εμφάνιση των τεχνολογιών γονιδιακών εκφράσεων υψηλών αποδόσεων, όπως μικροσυστοιχίες (microarrays) και αλληλουχία RNA (RNAseq) καθώς και η πρόσφατη μείωση του κόστους, οδήγησαν στην έκρηξη δημόσιων-διαθέσιμων συνόλων δεδομένων. Τα παραγόμενα σύνολα δεδομένων είναι αναπόφευκτα μεγάλης διάστασης με τυπικά μικρό μέγεθος δείγματος που περιορίζει σοβαρά τη δυνατότητα δημιουργίας αναπαραγώγιμων προγνωστικών μοντέλων. Η δυνατότητα αύξησης της προβλεπτικής ισχύος χωρίς απώλεια πληροφοριών του μετρηθέντος γονιδιώματος σε ένα νεοσύστατο σύνολο δεδομένων είναι ύψιστης σημασίας. Παρά το γεγονός ότι διάφορες μελέτες έχουν προσπαθήσει να επιτύχουν μείωση των διαστάσεων και συγχώνευση συνόλων δεδομένων, ώστε να αυξηθεί η απόδοση και η ευρωστία της ταξινόμησης, εξακολουθούν να υπάρχουν προκλήσεις κυρίως λόγω του περιορισμένου αριθμού δεδομένων καθώς και της τεχνολογικής ποικιλομορφίας και ετερογένειας στα σύνολα δεδομένων. Αξιοποιώντας την πλεοναστικότητα των γονιδιακών δεδομένων, κατασκευάσαμε καθολικούς κρυμμένους χώρους μικρότερων διαστάσεων του γονιδιώματος, χρησιμοποιώντας διάφορες προσεγγίσεις μείωσης των διαστάσεων και ένα ποικίλο σύνολο συνόλων δεδομένων. Οι τεχνικές Principal Component Analysis (PCA), kernel PCA και Neural Network Autoencoder εφαρμόστηκαν σε σύνολα δεδομένων από τέσσερις διαφορετικές πλατφόρμες. Ενώ οι γραμμικές τεχνικές έδειξαν καλύτερες επιδόσεις ανασυγκρότησης, οι μη γραμμικές προσεγγίσεις ήταν σε θέση να καταγράψουν πιο πολύπλοκες γονιδιακές αλληλεπιδράσεις, απολαμβάνοντας έτσι ισχυρότερη προβλεπτική δύναμη. Όταν νεοφανή σύνολα γονιδιακών εκφράσεων προβάλλονται σε ένα κρυμμένο χώρο 200 διαστάσεων η προβλεπτική ισχύς βελτιώθηκε. Επιπλέον, πραγματοποιήσαμε ένα πείραμα μεγάλης κλίμακας, όπου οι μέθοδοι μείωσης των διαστάσεων εκπαιδεύτηκαν σε ένα σύνολο 59864 μοναδικών δειγμάτων. Η ισχύς ταξινόμησης βελτιώθηκε περαιτέρω ειδικά για την τεχνική Autoencoder. Απροσδόκητα, η στατιστική μεταβλητότητα των πρόσθετων συνόλων δεδομένων αύξησε την απόδοση ταξινόμησης υπονοώντας ότι μαθεύτηκαν καλύτερα περίπλοκα βιολογικά χαρακτηριστικά. Επιπλέον, εξετάσαμε τη δυνατότητα αύξησης των δεδομένων χρησιμοποιώντας δεδομένα από διάφορες πλατφόρμες, κατασκευάζοντας ένα ενδιάμεσο χώρο χαρακτηριστικών που δείχνει ότι όταν οι πλατφόρμες μοιράζονται κοινά χαρακτηριστικά (όπως GLP570 και GLP96) βελτιώνεται η προβλεπτική απόδοση.
Φυσική περιγραφή xvi, 53 σ. : σχεδ., πιν., εικ. ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Dimensional reduction
Gene expression
Machine learning
Γονιδιακή έκφραση
Μηχανική μάθηση
Συμπίεση διαστάσεων
Ημερομηνία έκδοσης 2017-11-24
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 55

Ψηφιακά τεκμήρια
No preview available

Δεν έχετε δικαιώματα για να δείτε το έγγραφο.
Δεν θα είναι διαθέσιμο έως: 2018-05-24