Περίληψη |
Στη βιβλιογραφία έχουν προταθεί αρκετοί λογικοί φορμαλισμοί με σκοπό την έκφραση δομικών και σημασιολογικών περιορισμών ακεραιότητας, στο πλαίσιο των Δια-συνδεδεμένων Ανοιχτών Δεδομένων (Linked Open Data - LOD). Ωστόσο, η ανάγκη βελτίωσης της ποιότητας των δεδομένων που δημοσιεύονται στο σύννεφο Διασυνδεδεμένων Ανοιχτών Δεδομένων (LOD Cloud) παραμένει, καθώς τα δημοσιευμένα α¬νοιχτά δεδομένα συχνά παραβιάζουν τέτοιου είδους περιορισμούς ακεραιότητας. Αυτή η έλλειψη συνέπειας των δεδομένων με τους περιορισμούς, μπορεί να θέσει σε κίνδυνο την αξία εφαρμογών που καταναλώνουν ανοιχτά δεδομένα με αυτόματο τρόπο.
Μία βασική πρόκληση για τη βελτίωση της ποιότητας των δεδομένων, είναι η παροχή στους διαχειριστές των γνωσιακών βάσεων, εργαλείων που θα τους βοηθούν στον εντοπισμό παραβιάσεων των περιορισμών ακεραιότητας, καθώς και στην επίλυση τέτοιων παραβιάσεων.
Στην εργασία αυτή προτείνεται ένα νέο, πλήρως αυτόματοματοποιημένο πλαίσιο εντοπισμού παραβιάσεων περιορισμών ακεραιότητας σε γνωσιακές βάσεις, εκτελών¬τας τις απαραίτητες επερωτήσεις, καθώς και επιδιόρθωσης αυτών των παραβιάσεων, αφαιρώντας ασυνεπή δεδομένα από τη γνωσιακή βάση. Η μέθοδος που παρουσιάζε¬ται, λαμβάνει υπόψη την οντολογική γνώση που είτε προκύπτει από ρητές δηλώσεις, είτε προκύπτει σα συμπέρασμα από συνδυασμό ρητών δηλώσεων, χρησιμοποιώντας τη γλώσσα οντολογιών DL-LiteA για την έκφραση χρήσιμων λογικών περιορισμών, καθώς και για τον εντοπισμό δεδομένων που είναι ασυνεπή με αυτούς τους περιορισμούς, διατηρώντας, παράλληλα, καλές ιδιότητες υπολογιστικής πολυπλοκότητας.
Το πλαίσιο που προτείνεται αποτελείται από συστατικά μέρη που μπορούν να υλοποιηθούν ανεξάρτητα το ένα με το άλλο, δίνοντας έτσι τη δυνατότητα για τη χρησιμοποίηση έτοιμων, σύγχρονων, βελτιστοποιημένων εργαλείων για διάφορες λειτουργίες, όπως είναι η εκτέλεση επερωτήσεων.
Στα πλαίσια αυτής της εργασίας, παρουσιάζεται η υλοποίηση του πλαισίου, κα¬θώς και η αξιολόγηση της επίδοσής του, από την οποία εξάγεται το συμπέρασμα ότι μπορεί να χρησιμοποιηθεί για μεγάλα σύνολα δεδομένων και για μεγάλους αριθμούς παραβιάσεων, που παρατηρούνται στην πραγματικότητα σε γνωστές γνωσιακές βάσεις αναφοράς, όπως η DBpedia. Από την αξιολόγηση εξάγεται, επίσης, το συμπέρασμα πως το πλαίσιο που παρουσιάζεται σε αυτή την εργασία μπορεί να χρησιμοποιηθεί πάνω από γνωσιακές βάσεις που είναι ήδη σε λειτουργία, χωρίς καμία επιπλέον παραμετροποίηση.
|