Your browser does not support JavaScript!

Αρχική    Mature miRNA identification via the use of a Naive Bayes classifier  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000342573
Τίτλος Mature miRNA identification via the use of a Naive Bayes classifier
Συγγραφέας Γκίρτζου, Αικατερίνη
Σύμβουλος διατριβής Τσακαλίδης, Πάνος
Περίληψη Τα microRNAs είναι μικρά μονόκλωνα μόρια RNAs, με μήκος 22 νουκλεοτιδίων κατά μέσο όρο, τα οποία παράγονται από ενδογενή μετάγραφα με μορφή ‘φουρκέτας’ και έχουν μέτα–μεταγραφική δραστηριότητα. Παρόλο που υπάρχουν πολλές υπολογιστικές μέθοδοι διαθέσιμες για την αναγνώριση microRNA γονιδίων στο γονιδίωμα πολλών οργανισμών, πολύ λίγοι αλγόριθμοι μπορούν με ακρίβεια να προβλέψουν το λειτουργικό μέρος ενός miRNA γονιδίου, γνωστό ως ώριμοmiRNA. Στην εργασία αυτή προτείνουμε μια νέα υπολογιστική μέθοδος, η οποία χρησιμοποιεί έναν Naive Bayes classifier για να αναγνωρίζει υποψήφια ώριμα μόρια miRNA με ϐάση την ακολουθία και την δευτεροταγή δομή ενός πρώιμου miRNA (precursor miRNA). Συγκεκριμένα, για κάθε ώριμο miRNA, παράγουμε ένα σύνολο αρνητικών παραδειγμάτων ίσου μεγέθους, από τα αντίστοιχα πρώιμα μόρια miRNA. Τα δείγματα από τα πραγματικά και αρνητικά δεδομένα χρησιμοποιούνται κατόπιν για να εκτιμήσουμε τις κατανομές πιθανοτήτων των ϑέσεων που ϐρίσκονται είτε κατα μήκος του ώριμου μορίου, είτε σε περιοχες γύρω από αυτό, κρατώντας πληροφορίες για την ακολουθιά και την δευτεροταγή δομή της ϑέσης, καθώς και για την εκτίμηση των αποστάσεων της αρχικής καιτελικής ϑέσης ενός ώριμου μορίου από τα όρια του κοντινότερου σχηματισμού ‘φουρκέτας’ του πρώιμου μορίου, καθώς και από τα άκρα του ίδιου του πρώιμου μορίου. Η απόκλιση μεταξύ αυτών των κατανομών υπολογίζεται από την συμμετρική απόκλιση των Kullback–Leibler. Τα χαρακτηριστικά των οποίων οι δύο κατανομές διαφέρουν σημαντικά χρησιμοποιούνται ως χαρακτηριστικά για την εκπαίδευση του Naive Bayes classifier. Χρησιμοποιούμε πειραματικά επιβεβαιωμέναmiRNA δεδομένα από άνθρωπο και ποντίκι για την εκπαίδευση του μοντέλου μας και επιτυχγάνουμε μέση απόδοση AUC _ 0.88 χρησιμοποιώντας 10–fold cross validation. Επιπλέον εξετάζουμε τέσσερις στρατηγικές για να παρέχουμε με μεγαλύτερη ακρίβεια ένα υποψήφιο ώριμο μόριο, ϐασισμένοι στην διάταξη των αποτελεσμάτων που παρέχει το μοντέλο μας. Για κάθε μια στρατηγική, η ϐεβαιότητα ότι η υπολογιστική αλήθεια ϐρίσκεται ±6nt μακριά από το πραγματικό ώριμο miRNA είναι :
α) 86.88% για το υποψήφιο με την υψηλότερη επίδοση (top scorer),
ϐ) 88.25% για το υποψήφιο που σχηματίζεται από το μεσαίο στοιχείο του διαστήματος που ορίζουν οι τέσσερις υποψήφιοι με την υψηλότερη επίδοση,
ς) 89.34% για το υποψήφιο που σχηματίζεται από τη μεσή τιμή του διαστήματος που ορίζουν οι τέσσερις υποψήφιοι με την υψηλότερη επίδοση,
δ) 87.83% για τον υποψήφιο με την υψηλότερη επίδοση (top scorer), και την απένταντι αλληλουχία του όπως ορίζεται από την δευτεροταγή δομή του πρώιμο μορίου (duplex). Τα αποτελέσματά μας προτείνουν ότι η πληφορορίες ακολουθιάς και δευτεροταγής δομής που παρέχονται σε επίπεδο ϑέσεων, καθώς και οι χαρακτηριστικές αποστάσεις των ορίων του ώριμου μορίου miRNA σε συνδυασμό με έναν Naive Bayes classifier επιτυγχάνουν πολύ καλή απόδοση στο δύσκολο πρόβλημα της αναγνώρισης των ώριμων μορίων miRNA.
Φυσική περιγραφή xiii, 66 σ. : εικ. ; 30 cm.
Γλώσσα Αγγλικά
Ημερομηνία έκδοσης 2009-04-02
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 149

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 12