Your browser does not support JavaScript!

Αρχική    Question answering over CIDOC-CRM based knowledge graphs  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000460702
Τίτλος Question answering over CIDOC-CRM based knowledge graphs
Άλλος τίτλος Απάντηση ερωτήσεων επί γνωσιακών γράφων που βασίζονται στο CIDOC -CRM
Συγγραφέας Γουνάκης, Νικόλαος Ν.
Σύμβουλος διατριβής Τζίτζικας, Γιάννης
Μέλος κριτικής επιτροπής Πλεξουσάκης, Δημήτριος
Μαγκούτης, Κωνσταντίνος
Περίληψη Το CIDOC-CRM είναι ένα διεθνές πρότυπο για την τεκμηρίωση πολιτιστικών αγαθών το οποίο βασίζεται σε γεγονότα (event-based model) το οποίο επιτρέπει τη μοντελοποίηση, ανταλλαγή και συνάθροιση ετερογενών πληροφοριών πολιτισμικής κληρονομιάς και την επίτευξη σημασιολογικής διαλειτουργικότητας. Παρά την ύπαρξη πολλαπλών Γνωσιακών Γράφων (Knowledge Graphs) που χρησιμοποιούν το CIDOCCRM , το πρόβλημα της απάντησης ερωτήσεων (QA) πάνω σε τέτοιους γράφους δεν έχει διερευνηθεί εκτενώς, εξαιτίας α) της πολυπλοκότητας του μοντέλου CIDOCCRM , β) της έλλειψης ροών εργασιών για την απάντηση ερωτήσεων για event-based μοντέλα, και γ) της απουσίας συλλογών για την αξιολόγηση μηχανισμών απάντησης ερωτήσεων που αφορούν Γνωσιακούς Γράφους βασισμένους σε CIDOC-CRM. Για την αντιμετώπιση αυτών των προβλημάτων, στην παρούσα εργασία προτείνουμε και αξιολογούμε μια ροή εργασιών για απάντηση ερωτήσεων πάνω σε γνωσιακούς γράφους που έχουν μοντελοποιηθεί με τη χρήση του CIDOC-CRM, η οποία βασίζεται στην ακτίνα (βάθος) του γράφου. Η μέθοδος έχει σχεδιαστεί κυρίως για ερωτήματα που αφορούν ένα συγκεκριμένο γεγονός για μία οντότητα (single factoid questions), και δευτερευόντως για ερωτήματα που αφορούν την απάντηση ερωτήσεων επιβεβαίωσης (confirmation questions). Συγκεκριμένα, παρουσιάζουμε μία γενική ροή εργασιών που αποτελείται από διάφορα μοντέλα και μεθόδους, όπως ένα μοντέλο αναζήτησης λέξεων-κλειδιών για τον εντοπισμό της οντότητας της ερώτησης (και τη σύνδεσή της με τον γνωσιακό γράφο), μεθόδους που βασίζονται στην επέκταση του μονοπατιού της οντότητας για τη δημιουργία υπογράφων διαφορετικής ακτίνας (ή βάθους) ξεκινώντας από την αρχική οντότητα με σκοπό την δημιουργία ενός κειμένου σε φυσική γλώσσα, και προ-εκπαιδευμένα νευρωνικά μοντέλα (με βάση το BERT ) για την απάντηση της ερώτησης χρησιμοποιώντας το προαναφερθέν κείμενο. Επιπλέον, δεδομένης της έλλειψης συλλογών αξιολόγησης για την αξιολόγηση ερωτήσεων/απαντήσεων που αφορούν CIDOC-CRM γνωσιακούς γράφους, παρουσιάζουμε τη δημιουργία μιας συλλογής αξιολόγησης (χρησιμοποιώντας έναν πραγματικό γράφο με δεδομένα από μουσεία) που περιλαμβάνει 10.000 ερωτήσεις (και απαντήσεις). Συγκεκριμένα 5.000 ερωτήσεις που αφορούν ένα συγκεκριμένο γεγονός για μία οντότητα, 2.500 συγκριτικές ερωτήσεις και 2.500 ερωτήσεις επιβεβαίωσης. Για την αξιολόγηση της ροής εργασιών, χρησιμοποιούμε τις 5.000 ερωτήσεις που αφορούν γεγονότα για μία οντότητα και τις 2.500 ερωτήσεις επιβεβαίωσης. Όσον αφορά τα αποτελέσματα της αξιολόγησης, η ροή εργασιών επιτυγχάνει ικανοποιητικά αποτελέσματα για τις ερωτήσεις γεγονότων για μία οντότητα, τόσο στο στάδιο της αναγνώρισης οντοτήτων (78% ακρίβεια) όσο και στη διαδικασία απάντησης ερωτήσεων (51% F1 score ), ενώ για τις ερωτήσεις επιβεβαίωσης τα αντίστοιχα αποτελέσματα είναι 54% ακρίβεια για τον εντοπισμό οντότητας και 76% ακρίβεια για μια προκατειλημμένη (biased ) μέθοδο που γνωρίζει εκ των προτέρων το βάθος, συμπεραίνοντας την ανάγκη ενός μηχανισμού για την πρόβλεψη του βάθους της ακτίνας του υπο-γράφου για κάθε απάντηση. Τέλος, δημιουργούμε μια απλή διαδικτυακή εφαρμογή που επιτρέπει στους χρήστες να κάνουν ερωτήσεις σε γνωσιακούς γράφους CIDOC-CRM χρησιμοποιώντας την ροή εργασιών που αναφέραμε.
Φυσική περιγραφή vi, 49 σ. : σχεδ., πιν., εικ. (μερ. εγχρ.) ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Natural language processing
Γνωσιακοί γράφοι
Επεξεργασία φυσικής γλώσσας
Ημερομηνία έκδοσης 2023-12-01
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 837

Ψηφιακά τεκμήρια
No preview available

Κατέβασμα Εγγράφου
Προβολή Εγγράφου
Εμφανίσεις : 7