ERROR [2] DOMDocument::loadXML(): error parsing attribute name in Entity, line: 92
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): attributes construct error in Entity, line: 92
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): Couldn't find end of Start Tag search_coll line 92 in Entity, line: 92
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): expected '>' in Entity, line: 92
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): Opening and ending tag mismatch: raw line 52 and search_coll in Entity, line: 92
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): error parsing attribute name in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): attributes construct error in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): Couldn't find end of Start Tag search_coll line 93 in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): expected '>' in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): Opening and ending tag mismatch: session line 2 and search_coll in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

ERROR [2] DOMDocument::loadXML(): Extra content at the end of the document in Entity, line: 93
Fatal error on line 173 in file /home/dlib-portal/lib/php-handlers/neo_session.php

E-Locus - Ιδρυματικό Καταθετήριο Πανεπιστημίου Κρήτης - Διδακτορικές διατριβές

Αρχική    Συλλογές    Τύπος Εργασίας    Διδακτορικές διατριβές  

Διδακτορικές διατριβές

Τρέχουσα Εγγραφή: 5 από 2427

Πίσω στα Αποτελέσματα Προηγούμενη σελίδα
Επόμενη σελίδα
Προσθήκη στο καλάθι
[Προσθήκη στο καλάθι]
Κωδικός Πόρου 000463783
Τίτλος Deception detection from text in a multilingual and multicultural context
Άλλος τίτλος Ανίχνευση εξαπάτησης από κείμενο σε πολυγλωσσικό και πολυπολιτισμικό πλαίσιο
Συγγραφέας Παπαντωνίου, Αικατερίνη Χ.
Σύμβουλος διατριβής Πλεξουσάκης, Δημήτριος
Μέλος κριτικής επιτροπής Φλουρής, Γεώργιος
Τζίτζικας, Γιάννης
Αργυρός, Αντώνιος
Κομοδάκης, Νίκος
Ανδρουτσόπουλος, Ίων
Σταματάτος, Ευστάθιος
Περίληψη Η αυτόματη εξαγωγή εξαπάτησης από κείμενο είναι μια κρίσιμη εργασία με εφαρμογές τόσο στην άμεση φυσική επικοινωνία όσο και στην επικοινωνία ανθρώπων μέσω υπολογιστή. Σε αυτή τη διατριβή, εστιάζουμε στον αυτόματο εντοπισμό εξαπάτησης σε κείμενο μεταξύ πολιτισμών και διαφορετικών γλωσσών. Σε αυτό το πλαίσιο, βλέπουμε τον πολιτισμό μέσα από το πρίσμα της διάστασης ατομικισμού/συλλογικότητας και προσεγγίζουμε τον πολιτισμό χρησιμοποιώντας τη χώρα ως αντιπρόσωπο. Έχοντας ως αφετηρία τα πρόσφατα συμπεράσματα από τον κλάδο της κοινωνικής ψυχολογίας, διερευνούμε εάν οι διαφορές στη χρήση συγκεκριμένων γλωσσικών ενδείξεων εξαπάτησης μεταξύ των πολιτισμών μπορούν να επιβεβαιωθούν και να αποδοθούν σε πολιτισμικούς κανόνες σε σχέση με το διαχωρισμό ατομικισμού/συλλογικότητας. Επιπλέον, διερευνούμε εάν υπάρχει ένα καθολικό σύνολο χαρακτηριστικών για διαπολιτισμικές εργασίες εντοπισμού παραπλάνησης κειμένου. Για αυτούς τους στόχους, πραγματοποιήσαμε μια ενδελεχή στατιστική ανάλυση (δοκιμές Mann-Whitney και Πολλαπλή Λογιστική Παλινδρόμηση) σε έντεκα σύνολα δεδομένων από πέντε γλώσσες (αγγλικά, ολλανδικά, ρωσικά, ισπανικά και ρουμανικά) και έξι χώρες (Ηνωμένες Πολιτείες Αμερικής, Βέλγιο, Ινδία, Ρωσία, Μεξικό και Ρουμανία). Η ανάλυση έδειξε την απουσία ενός καθολικού συνόλου χαρακτηριστικών και επίσης την αστάθεια και την ευαισθησία των ενδείξεων εξαπάτησης ακόμη και σε σύνολα δεδομένων εντός της ίδιας κουλτούρας/γλώσσας. Επιπλέον, η ανάλυση αποκάλυψε ορισμένες διαφορές στα σημάδια εξαπάτησης μεταξύ των πολιτισμών και των γλωσσών, π.χ. στην έκφραση του συναισθήματος και ταυτόχρονα στη διαπολιτισμική εγκυρότητα ορισμένων άλλων. Για να αξιολογήσουμε την προγνωστική ισχύ διαφορετικών συνόλων χαρακτηριστικών και προσεγγίσεων, δημιουργήσαμε ταξινομητές πειραματιζόμενοι με ένα ευρύ φάσμα χαρακτηριστικών ν-γραμμάτων από διάφορα επίπεδα γλωσσικής ανάλυσης, συγκεκριμένα φωνολογία, μορφολογία και σύνταξη, άλλα γλωσσικά στοιχεία όπως μετρήσεις φωνημάτων, αντωνυμιών κλπ., καθώς και embeddings. Πειραματιστήκαμε επίσης με τον συνδυασμό αυτών των χαρακτηριστικών, ενώ τα προαναφερθέντα σύνολα δεδομένων χρησιμοποιήθηκαν για εκπαίδευση/δοκιμές. Εφαρμόσαμε δύο μεθόδους ταξινόμησης, Λογιστική Παλινδρόμηση και με το fine-tuning τόσο μονογλωσσικών όσο και πολυγλωσσικών μοντέλων BERT. Συνολικά, τα fine-tuned μοντέλα ξεπερνούν τις άλλες προσεγγίσεις, αλλά είναι ενδιαφέρον ότι υπάρχουν περιπτώσεις που ο συνδυασμός BERT embeddings με γλωσσικά χαρακτηριστικά είναι επωφελής. Ο πειραματισμός με τα πολυγλωσσικά μοντέλα ως μια περίπτωση zero-shot transfer learning έδειξε υποσχόμενα αποτελέσματα. Για να διερευνήσουμε την εξαπάτηση σε διαφορετικά από τα παραπάνω πεδία εισάγουμε μια νέα συλλογή δεδομένων που αφορά πρωταπριλιάτικα άρθρα για την ελληνική γλώσσα. Από όσο γνωρίζουμε, αυτό είναι η πρώτη ελεύθερη διαθέσιμη συλλογή σχετιζόμενη με εξαπάτηση για τα ελληνικά. Τα συμπεράσματα που βασίζονται σε παρόμοια ανάλυση με την παραπάνω και η σύγκριση με μια ανάλογη συλλογή στα αγγλικά ευθυγραμμίζονται με τα αποτελέσματα του πρώτου μέρους της διατριβής. Τέλος, εστιάζουμε στο πόσο καλά μπορούν να γενικευτούν διάφορα μοντέλα αυτόματης ανίχνευσης εξαπάτησης σε δεδομένα που δεν εξασφαλίζεται ότι ακολουθούν την υπόθεση ανεξαρτησίας και ίδιας κατανομής. Χρησιμοποιώντας ένα πλούσιο σύνολο διαφορετικών δεδομένων για δοκιμές στα αγγλικά και στα ισπανικά, διερευνούμε τη διαφορά απόδοσης μεταξύ των μοντέλων που εξετάστηκαν. Τεχνικές γενίκευσης από τη βιβλιογραφία εξετάζονται επίσης σε μια προσπάθεια να ενισχυθούν οι δυνατότητες γενίκευσης των μοντέλων. Οι προσεγγίσεις που βασίζονται σε transformers γενικά υπερτερούν των προσεγγίσεων που βασίζονται μόνο σε γλωσσικά χαρακτηριστικά, αλλά τόσο ο συνδυασμός τους με ρητές ενδείξεις εξαπάτησης όσο και οι τεχνικές γενίκευσης είναι επωφελείς.
Φυσική περιγραφή xxii, 213 σ. : πίν., σχήμ., εικ. ; 30 εκ.
Γλώσσα Αγγλικά
Θέμα Culture
Machine learning
NLP
Επεξεργασία φυσικής γλώσσας
Κουλτούρα
Μηχανική μάθηση
Ημερομηνία έκδοσης 2024-03-22
Συλλογή   Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Διδακτορικές διατριβές
  Τύπος Εργασίας--Διδακτορικές διατριβές
Μόνιμη Σύνδεση https://elocus.lib.uoc.gr//dlib/2/5/3/metadata-dlib-1712296616-817333-1577.tkl Bookmark and Share
Εμφανίσεις 7

Ψηφιακά τεκμήρια
No preview available

Δεν έχετε δικαιώματα για να δείτε το έγγραφο.
Δεν θα είναι διαθέσιμο έως: 2027-03-22