Your browser does not support JavaScript!

Αρχική    SPIMBench : a scalable, schema-aware instance matching benchmark for the semantic publishing domain  

Αποτελέσματα - Λεπτομέρειες

Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000388638
Τίτλος SPIMBench : a scalable, schema-aware instance matching benchmark for the semantic publishing domain
Άλλος τίτλος Ένα κλιμακώσιμο με επίγνωση σχήματος πλαίσιο αξιολόγησης συστημάτων αντιστοίχισης στιγμιότυπων για τη δημοσίευση σημασιολογικά εμπλουτισμένων δεδομένων
Συγγραφέας Σαβέτα, Τζανίνα Α.
Σύμβουλος διατριβής Πλεξουσάκης, Δημήτρης
Μέλος κριτικής επιτροπής Τζίτζικας, Ιωάννης
Φουντουλάκη, Ειρήνη
Περίληψη Τα τελευταία χρόνια, η αύξηση των διαθέσιμων Συνδεδεμένων Δεδομένων (Linked Data) στον Παγκόσμιο ιστό έχει αποτελέσει τον θεμέλιο λίθο στην ανάπτυξη Συστημάτων Αντιστοίχισης Στερεοτύπων (Instance Matching Systems). Όπως για τα συστήματα Βάσεων Δεδομένων, έτσι και εδώ, Πλαίσια Αξιολόγησης Συστημάτων Αντιστοίχισης Στιγμιότυπων (Instance Matching Benehmarks) έχουν αναπτυχθεί για τον έλεγχο απόδοσης των προαναφερθέντων συστημάτων με βασικό σκοπό τον προσδιορισμό των μειονεκτημάτων τους για την περαιτέρω βελτίωση των λειτουργιών τους. Ένα πλαίσιο αξιολόγησης συστημάτων ταυτοποίησης στιγμιότυπων θα πρέπει να ελέγχει τη συνολική ποιότητα του συστήματος αντιστοίχισης στιγμιότυπων με μετρικές όπως η ακρίβεια (precision), η ανάκληση (recaII), και το F-measure καθώς και την ικανότητα να χειρίζεται σύνολα δεδομένων μεγάλου όγκου. Πλαίσια αξιολόγησης έχουν ήδη προταθεί για τον έλεγχο της απόδοσης συστημάτων αντιστοίχισης στιγμιότυπων για δεδομένα και δεδομένα σχεσιακών βάσεων και πρόσφατα για τα δεδομένα τα οποία έχουν αρχίσει να επικρατούν στον Παγκόσμιο Ιστό. Τα συστήματα αξιολόγησης που λαμβάνουν υπ' όψιν δεδομένα εκφρασμένα σε είναι τα πρώτα τα οποία εξέτασαν το πρόβλημα της αντιστοίχισης στιγμιότυπων όταν ένα αντικείμενο του πραγματικού κόσμου έχει διαφορετικές περιγραφές που χρησιμοποιούν τα ίδια ή διαφορετικά RDFS (ή τα εκφραστικότερα OWL) σχήματα. Αυτό σημαίνει πως εκτός από τις λεξικολογικές διαφορές μεταξύ των στιγμιότυπων που περιγράφουν την ίδια οντότητα του πραγματικού κόσμου, τα πλαίσια αξιολόγησης λαμβάνουν υπ' όψιν διαφορές σε επίπεδο σχήματος όπως τη διάσπαση ή τη συνάθροιση μίας ιδιότητας ενός στιγμιότυπου. Ωστόσο, σύμφωνα με τη βιβλιογραφία, κανένα από τα προτεινόμενα πλαίσια αξιολόγησης μέχρι σήμερα δεν λαμβάνει υπ' όψιν τις πιο πολύπλοκες δομές σε επίπεδο σχήματος τα οποία μπορούν να εκφραστούν, χρησιμοποιώντας τα πλούσια δομικά στοιχεία της γλώσσας του Σημασιολογικού Ιστού OWL. Οι μετασχηματισμοί που έχουν προταθεί παραμένουν όλοι στο επίπεδο των απλών δομών όπως εκείνες περιγράφονται στην γλώσσα RDFS . Στην παρούσα εργασία προτείνουμε το Sematic Publishing Instance Matching Benchmark , εν συντομία SPIMBench , ένα πλαίσιο αξιολόγησης εμπνευσμένο από το Sematic Publishing Benchmark SPB. Το SPIMBench , όπως το SPB, είναι βασισμένο στις οντολογίες όπως έχουν δοθεί από το BBC (http://www.bbc.com/) οι οποίες χρησιμοποιήθηκαν από τον συγκεκριμένο δημοσιογραφικό οργανισμό για την δημοσίευση Σημασιολογικά Εμπλουτισμένων Δεδομένων. Στο SPIMBench προτείνουμε και υλοποιούμε μία α) επεκτάσιμη γεννήτρια δεδομένων, β) ένα σύνολο μετασχηματισμών πού αποτελούνται από τους καθιερωμένους λεξικολογικούς, δομικούς και μετασχηματισμούς σε επίπεδο λογικού σχήματος. Οι τελευταίοι μετασχηματισμοί υπερβαίνουν τα καθιερωμένα δομικά στοιχεία και περιλαμβάνουν εκφραστικά δομικά στοιχεία όπως ισότητα/ανισότητα στιγμιότυπων, ισοδυναμία των κλάσεων και των ιδιοτήτων σε επίπεδο σχήματος, περιορισμό ιδιοτήτων, περίπλοκους ορισμούς κλάσεων, και τέλος γ) έναν σταθμισμένο χρυσό κανόνα ο οποίος μπορεί να χρησιμοποιηθεί για τον εντοπισμό σφαλμάτων στα συστήματα αντιστοίχισης στιγμιότυπων.
Φυσική περιγραφή vi, 68 σ. : πίν., εικ. ; 30 εκ.
Γλώσσα Αγγλικά, Ελληνικά
Ημερομηνία έκδοσης 2014-11-21
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Μεταπτυχιακές εργασίες ειδίκευσης
  Τύπος Εργασίας--Μεταπτυχιακές εργασίες ειδίκευσης
Εμφανίσεις 194

Ψηφιακά τεκμήρια
No preview available

Προβολή Εγγράφου
Εμφανίσεις : 32