Περίληψη |
Τα Διασυνδεδεμένα Δεδομένα
(
Linked
Data
)
είναι ένας
τρόπο
ς
δημοσίευσης δεδομένων που
επιτρέπει τη διασύνδεσ
ή
τους
(
μέσ
ω
της χρήσης
URIs
αντί απλών τιμών)
και διευκολύνει την
ολοκλήρωσ
ή
τους.
Ήδη υπάρχουν χιλιάδες τέτοια σύνολ
α
δεδομένων, στο εξής πηγές, και ο
αριθμός και το μέγεθος τους διαρκώς αυξάνεται. Παρά ταύτα, αυτή τη στιγμή είναι δύσκολο να
εκτιμήσει κανείς πόσ
ο συνδεδεμένες είναι αυτές οι πηγές, και συγκεκριμέν
α είναι δύσκολη
(α)
η εύρεση όλων των δεδομένων
που αφορούν ένα
συγκεκριμένο URI, (β)
η ανακάλυψη
μια
ς
πηγή
ς
που σχετίζεται με μία άλλη, (γ)
ο υπολογισμός και η οπτικοποίηση του βαθμού
διασύνδεσης μεταξύ
δύο
ή περισσότερων
πηγών
.
Τα παραπάνω είναι αναγκαία
στη
διαδικασία
ολοκλήρωσης σε ένα ανοικτό και εξελισσόμενο
περιβάλλον
.
Για να απαλύνουμε αυτό το πρόβλημα σε αυτήν την εργασία, παρουσιάζουμε μέτρα, ευρετήρια
και αλγορίθμους
που επιτρέπουν τη
μέτρηση
και ποσοτικοποίηση του βαθμού διασύνδεσης
πολλών πηγών. Για λόγους κλιμακωσιμότητας προτείνουμε
i
)
ένα ευρετήριο
για τα προθέματα
των
URIs
ii
)
έναν κατάλογο για σχέσεις ισοδυναμίας που λαμβάνει υπ’ όψιν του το συμμετρικό
και μεταβατικό κλείσιμο των σχέσεω
ν ισοδυναμίας που εμφανίζονται στα σύνολα δεδομένων,
iii
)
ένα σημασιολογικό
ευρετήριο
στοιχείων (που χρησιμοποιεί τα προαναφερθέντα ευρετήρια), iv
)
ένα πλέγμα
(
lattice
)
των κοινών στοιχείων που μετράει όλα τα κοινά στοιχεία ενός συνόλου
πηγών, και
v
)
δύο
αυξητικούς αλγορίθμους που επιταχύνουν τον υπολογισμό
του πλέγματος.
Εφαρμόζουμε και αξιολογούμε την προσέγγιση τόσο στο πλαίσιο μια
ς συγκεκριμένης
σημασιολογικής αποθήκης δεδομένων με πληροφορίες για θαλάσσια
εί
δη
(όπου εκεί τα μέτρα
αυτά χρησιμοποιούντ
αι για την αξιολόγηση της αποθήκης και των συνιστωσών πηγών
της,
καθώς και για
τον
έλεγχο της ποιότητας της αποθήκης μετά από ανακατασκευή)
, καθώς και σε
τρακόσες
πηγές του νέφους διασυνδεδεμένων δεδομένων. Αναφέρουμε τα αποτελέσματα
μετρήσεων που δεν έ
χουν γίνει στο παρελθόν
(
όπως το πλήθος της τομής των κοινών
URIs
μεταξύ
τριών ή παραπάνω πηγών
,
συχνότητα των
prefixes
,
κ.α.
)
, προσφέρουμε νέες υπηρεσίες (όπως
εύρεση ισοδύναμων
URIs
, εύρεση των κοντινότερων πηγών ως προς μία, κ.α.),
και
τέλος
αξιολογούμ
ε την επιτάχυνση που επιτυγχάνεται με τα προτεινόμενα ευρετήρια και αλγορίθμους.
Τέλος, προτείνουμε μία επέκταση της οντολογίας
VoID
που επιτρέπει τη δημοσίευση,
το
διαμοιρασμό
και την αξιοποίηση
τέτοιων μετρήσεων
.
|