Περίληψη |
Σε έναν δικτυωμένο κόσμο, το περιεχόμενο του Διαδικτύου αυξάνεται και είναι διαθέσιμο σε οποιονδήποτε έχει πρόσβαση σε έναν ηλεκτρονικό υπολογιστή και στο Διαδίκτυο. Υπάρχει όμως μόνο η πληροφορία που βλέπουμε online ή είναι και κάτι παραπάνω; Αναφερόμαστε στο World Wide Web περιεχόμενο το οποίο δεν γίνεται indexed από τις συμβατικές μηχανές αναζήτησης, με τον όρο Deep Web. Η μεταπτυχιακή αυτή εργασία αποτελεί μια προσέγγιση για τη διερεύνηση διαφόρων πτυχών του Deep Web που αφορούν ευαίσθητα προσωπικά δεδομένα.
Σε αυτό το πλαίσιο, διεξάγουμε δύο ευρεία case studies που αφορούν την διαρροή προσωπικών δεδομένων από το εσωτερικό του Deep Web. Αρχικά, εξετάζουμε δυναμικές σελίδες σαν περιεχόμενο του Deep Web. Τονίζουμε τα ζητήματα προστασίας των προσωπικών δεδομένων που έχουν προκύψει από την εισαγωγή του Αριθμού Μητρώου Κοινωνικής Ασφάλισης (ΑΜΚΑ), σε συνδυασμό με τη διαθεσιμότητα προσωπικών στοιχείων στα ελληνικά web sites. Στο δεύτερο case study, αναφερόμαστε στα metadata αρχείων σαν πληροφορία του Deep Web. Αναλύουμε τα metadata δεκαπέντε και άνω εκατομμυρίων online εγγράφων (DOC, PDF, XLS και PPT) και παρουσιάζουμε τις διαρροές ευαίσθητης πληροφορίας που προκύπτουν από την ανάλυση αυτή.
Ακόμη, προτείνουμε μια μέθοδο για την ανίχνευση διαρροής πληροφοριών η οποία αποτελεί μια βελτίωση του cyclical hashing , έτσι ώστε να επιταχύνει τον εντοπισμό διαρροών και να αυξάνει την ακρίβεια του αποτελέσματος. Τα πειράματα χρησιμοποιούν real-world δεδομένα που αποδεικνύουν την αποτελεσματικότητα και την αποδοτικότητα της προτεινόμενης λύσης.
|