Περίληψη |
Τα τελευταία 20 χρόνια έχουν αναπτυχθεί τεχνικές Next Generation Sequencing (NGS) που προσφέρουν
αυτόματη, γρήγορη, αξιόπιστη και φθηνή αλληλούχιση του γονιδιώματος ενός οργανισμού. Οι τεχνικές
αυτές, εξαιτίας των πλεονεκτημάτων τους βρίσκουν εξαιρετική εφαρμογή στα μοντέρνα συστήματα
υγείας και συγκεκριμένα στην διάγνωση και στα θεραπευτικά πρωτόκολλα. Μία τυπική NGS ροή ξεκινά
με την προετοιμασία του δείγματος και καταλήγει με την δημιουργία μιας αναφοράς που δίνεται στον
κλινικό. Η αναφορά περιλαμβάνει κυρίως μεταλλαγές που σχετίζονται με τον κλινικό φαινότυπο του
ασθενή. Δύο είναι οι σημαντικές διαδικασίες στην NGS ροή που οδηγούν στην δημιουργία της αναφοράς
και αυτές είναι το annotation και prioritization των παραλλαγών (variants) του εξεταζόμενου δείγματος.
Annotation, είναι η διαδικασία κατά την οποία το λογισμικο που υποστηρίζει ο αλληλουχιτής
χρησιμοποιεί πληροφορίες από συγκεκριμένες γενετικές βάσεις δεδομένων με σκοπό την περιγραφή των
παραλλαγών. Ενώ στο βήμα Prioritization εφαρμόζουμε διάφορα κριτήρια στις παραλλαγές με σκοπό να
τις ταξινομήσουμε σύμφωνα με τον βαθμό παθογένειας τους. Οι παραλλαγές που βρίσκονται να είναι πιο
ψηλά στην λίστα ταξινόμησης είναι αυτές που “δίνονται” στους κλινικούς. Η NGS ροή που ισχύει σε
όλες τις πλατφορμες αλληλούχισης είναι μία αυτοματοποιημένη διαδικασία ως το prioritization βήμα. Για
να μπορέσει ο αναλυτής να προχωρήσει στην prioritization διαδικασία και να ταξινομήσει τις παραλλαγές
που μελετά χρησιμοποιεί τις οδηγίες που έχουν δοθεί από το American College of Medical Genetics and
Genomics (ACMG). Ωστόσο, αυτές οι οδηγίες είναι ελλιπείς και αφήνουν “χώρο” στους γενετιστές για
υποκειμενικότητα στην ερμηνεία των αποτελεσμάτων. Η υποκειμενική ερμηνεία αυτών των οδηγιών, σε
συνδυασμό με την πληθώρα πληροφοριών για δεκάδες χιλιάδες μεταλλάξεις, δημιουργεί ένα αμήχανο
έδαφος για τον γενετιστή. Στην παρούσα πτυχιακή δημιουργήσαμε μία πλατφόρμα, την Zazz, με σκοπό
να βοηθήσουμε των γενετιστή στην παραπάνω διαδικασία. Η Zazz έχει δύο σημαντικούς στόχους να
υλοποιήσει. Ο πρώτος στόχος είναι η αποθήκευση των παραλλαγών και της annotation πληροφορίας σε
μία σχεσιακή βάση δεδομένων. Ο δεύτερος στόχος είναι η παροχή στον αναλυτή ενούς φιλικού
περιβάλλοντος πλοήγησης με σκοπό να μπορεί να εφαρμόσει απλά και γρήγορα ερωτήματα στην βάση
δεδομένων χωρίς την χρήση sql γλώσσας, όπως επίσης και να μπορεί να κάνει εύκολα fine tuning των
παραμέτρων ώστε να φτάσει στην ταξινόμηση των παραλλαγών. Συνεπώς, η Zazz πλατφόρμα παρέχει
ένα περιβάλλον πλοήγησης για τον χρήστη όπου μπορεί να εφαρμόσει περίπλοκα ερωτήματα και έπειτα
να οπτικοποιήσει και να πλοηγηθεί στις παραλλαγές που απαντούν τα ερωτήματα του μέσω μιας
μοντέρνας ομάδας εργαλειών που ονομάζεται javascript graph . Στην Zazz επίσης εισαγάγαμε και τον
D3GB με σκοπό την περιήγηση γονιδιώματος. Με την χρήση δεδομένων από whole exome sequencing
τεχνική που έχουν αλληλουχηθεί από τον Ion Torrent και έχουν γίνει annotation από τρια διαφορετικά
annotation λογισμικά, το Ion Reporter λογισμικό,και τα ανοιχτά προς τους χρήστες λογισμικά VEP και
ANNOVAR ελέγξαμε τη αποτελεσματικότητα της Zazz πλατφόρμας. Επιπλέον, η Zazz μπορεί να
διαχειριστεί custom annotation πεδία εισαγάγοντας δεδομένα από έναν custom αναλυτή της βάσης
δεδομένων ClinVar, ο οποίος εξάγει πεδία που παραλείπουν άλλες annotation πλατφόρμες.
Συνοψίζοντας, λοιπον, η Zazz είναι μία πλατφόρμα όπου βοηθάει τους γενετιστές να περιηγηθούν μέσα
σε έναν τεράστιο όγκο πληροφορίας με σκοπό να δημιουργήσουν σε μικρό χρονικό διάστημα την
αναφορά που δίνουν στους κλινικούς.
|