|
Κωδικός Πόρου |
000446952 |
Τίτλος |
Study on the effect of misinformation in multi-agent systems |
Άλλος τίτλος |
Μελέτη της επίδρασης της εσφαλμένης πληροφορίας σε πολυπρακτιρικά συστήματα |
Συγγραφέας
|
Βάρσος, Κωνσταντίνος Α
|
Σύμβουλος διατριβής
|
Πλεξουσάκης, Δημήτρης
|
Μέλος κριτικής επιτροπής
|
Τσαμαρδινός, Ιωάννης
Φλουρής, Γεώργιος
Φωτάκης, Δημήτριος
Μαρκάκης, Ευάγγελος
Χαλκιαδάκης, Γεώργιος
Schafer, Guido
|
Περίληψη |
Συχνά οι βιομηχανικές διεργασίες και οι ερευνητικές δραστηριότητες περιλαμβάνουν αλληλεπιδράσεις μεταξύ συμμετεχόντων (ήτοι πράκτορες, παίχτες). Η Θεωρία Παιγνίων αποτελεί,
συχνά, το εργαλείο με το όποιο μελετάμε τέτοιου είδους αλληλεπιδράσεις· συνήθως περιλαμβάνοντας την υπόθεση ότι οι πράκτορες έχουν κοινή και σωστή (χωρίς να είναι πάντοτε
πλήρης) πληροφορία σχετικά με την δραστηριότητα στην οποία συμμετέχουν. Ωστόσο, στον
πραγματικό κόσμο οι πράκτορες συχνά ενεργούν έχοντας λανθασμένη πληροφόρηση σχετικά
με την αλληλεπίδραση και τις συνθήκες της, χωρίς να το γνωρίζουν· ακυρώνοντας κατ΄ αυτόν
τον τρόπο την υπόθεση της κοινής και σωστής πληροφόρησης. Για να μελετήσουμε αυτό το
φαινόμενο, στην παρούσα διατριβή θεμελιώνουμε μια καινούργια δομή.
Αρχικά, εισάγουμε στην δομή μας μια καινούργια κλάση παιγνίων, την οποία ονομάζουμε
παίγνια εσφαλμένης πληροφορίας, η οποία μας παρέχει όλα τα αναγκαία θεωρητικά εργαλεία ώστε
να μελετήσουμε το φαινόμενο της αλληλεπίδρασης υπό εσφαλμένη πληροφορία. Αξιοσημείωτο
είναι ότι αυτή η κλάση παιγνίων παρέχει καινούργια σημεία ισορροπίας, τα οποία βασίζονται στα
σημεία ισορροπίας Nash. Παράλληλα, παρουσιάζουμε βασικές ιδιότητες της δομής αυτής και
την εφαρμόζουμε σε διάφορες κλασσικές κλάσεις παιγνίων. Ταυτοχρόνως, ορίζουμε μια νέα
μετρική η οποία ποσοτικοποιεί την επίδραση της εσφαλμένης πληροφορία στην απόδοση της
αλληλεπίδρασης.
Εν συνεχεία, επεκτείνουμε το μοντέλο των παιγνίων εσφαλμένης πληροφορίας, αναπτύσσοντας
μια επαναληπτική διαδικασία διακριτού χρόνου, όπου σε κάθε χρονικό βήμα κάθε πράκτορας
διαλέγει μια ενέργεια σύμφωνα με τις (πιθανώς εσφαλμένες) προδιαγραφές της αλληλεπίδρασης
που κατέχει. Κατόπιν, ανακοινώνονται δημόσια οι πραγματικές ανταμοιβές που λαμβάνουν
οι πράκτορες, σύμφωνα με τον συνδυασμό των επιλογών που έχουν κάνει· ενημερώνοντας
κατ’ αυτόν τον τρόπο την πληροφορία που κατέχουν. Ονομάζουμε αυτή την διαδικασία Διαδικασία Προσαρμογής και παρουσιάζουμε θεωρητικά αποτελέσματα σχετικά με τις ιδιότητες
της. Περαιτέρω, αναλύουμε την συμπεριφοράς των πρακτόρων καθώς η πληροφορία που κατέχουν
ενημερώνεται, και αποδεικνύουμε ότι αυτή οδηγεί σε καινούργια σημεία ισορροπίας.
΄Επειτα, διευρύνουμε την Διαδικασία Προσαρμογής ενσωματώνοντας την γνωσιολογική θεώρηση
που έχει ο κάθε πράκτορας σχετικά με την αλληλεπίδραση στην οποία συμμετέχει. Προς αυτή
την κατεύθυνση, ορίζουμε τυπικά την γνωσιολογική θεώρηση της Διαδικασίας Προσαρμογής
στα παίγνια εσφαλμένης πληροφορίας. Συγκεκριμένα, κατασκευάζουμε μια διαδικασία, την οποία
ονομάζουμε Γνωσιολογική Προσαρμοστική Εξέλιξη, κατά την οποία οι πράκτορες αναθεωρούν
τόσο την πληροφορία που κατέχουν όσο και την γνωσιολογική πληροφορία σχετικά με την
αλληλεπίδραση στην οποία συμμετέχουν. ΄Οπως και στα προηγούμενα σκέλη του μοντέλου μας,
αναδύονται καινούργια σημεία ισορροπίας. Με αυτό το μέρος της μελέτης, ολοκληρώνουμε την
δομή μέσω της οποίας μπορούμε να μελετήσουμε το φαινόμενο της αλληλεπιδράσης πρακτόρων
με εσφαλμένη πληροφορία.
Γίνεται άμεσα αντιληπτό ότι είναι σημαντικός ο υπολογισμός σημείων ισορροπίας (π.χ. Nash)
σε διάφορα σημεία του μοντέλου μας. Για τον λόγο αυτό, αναπτύσσουμε έναν καινούργιο on-line
αλγόριθμο μάθησης. Πιο συγκεκριμένα, προτείνουμε μια παραλλαγή της multiplicative weights
update μεθόδου, χρησιμοποιώντας best-response στρατηγικές, η οποία εγγυάται κατά σημείο
σύγκλιση για παίγνια μηδενικού αθροίσματος με μοναδικό σημείο ισορροπίας Nash.
Ως συνέχεια της μελέτης του φαινομένου της επίδρασης της εσφαλμένης πληροφορίας σε
αλληλεπιδράσεις πολλών πρακτόρων, αναλύουμε την επιρροή της δομής της εσφαλμένης πληροφορίας στην αλληλεπίδραση. Συγκεκριμένα, εισάγουμε μια νεα οικογένεια παιγνίων εσφαλμένης
πληροφορίας, την οποία ονομάζουμε παίγνια θορύβου, όπου η εσφαλμένη πληροφορία εξαρτάται
από τυχαίο θόρυβο, ο οποίος προστίθεται στις τιμές των ανταμοιβών. Κατόπιν, αναλύουμε τις
γενικές ιδιότητες των παιγνίων θορύβου δύο παιχτών και εξάγουμε θεωρητικά αποτελέσματα
ως προς την επίδραση του θορύβου στην στρατηγική συμπεριφορά των πρακτόρων.
Τέλος, η μελέτη ολοκληρώνεται με την ανάλυση της αλληλεπίδρασης από την σκοπιά του
σχεδιαστή της. Πιο συγκεκριμένα, παρουσιάζουμε μια νεα προσέγγιση στην περιοχή των Coordination mechanisms, βασιζόμενοι στην ιδέα ότι παρέχοντας εσφαλμένη πληροφορία στους
πράκτορες, σχετικά με τις προδιαγραφές της αλληλεπίδρασης, μπορούμε να τους κατευθύνουμε
σε συμπεριφορές που βελτιώνουν την απόδοση της αλληλεπίδρασης, με όρους συλλογικής πρόνοιας.
Προτείνουμε έναν μηχανισμό που παρέχει στους πράκτορες τα κατάλληλα κίνητρα ώστε να υιοθετήσουν μια συλλογικά καλύτερη συμπεριφορά.
|
Φυσική περιγραφή |
xxv, 175 σ. : σχεδ., πιν., εικ. ; 30 εκ. |
Γλώσσα |
Αγγλικά |
Θέμα |
Adaptation Procedure |
|
Epistemic Adaptive Evolution |
|
Epistemic games |
|
Epistemic natural equilibrium |
|
Misinformation games |
|
Natural misinformed equilibrium |
|
Stable epistemic natural equilibrium |
|
Stable misinformed equilibrium |
|
Γνωσιολογικά Παίγνια |
|
Γνωσιολογική Προσαρμοστική Εξέλιξη |
|
Γνωσιολογικό φυσικό σημείο ισορροπίας |
|
Διαδικασία Προσαρμογής |
|
Ευσταθές γνωσιολογικό φυσικό σημείο ισορροπίας |
|
Ευσταθές φυσικό σημείο ισορροπίας εσφαλμένης πληροφορίας |
|
Παίγνια εσφαλμένης πληροφορίας |
|
Φυσικό σημείο ισορροπίας εσφαλμένης πληροφορίας |
Ημερομηνία έκδοσης |
2022-03-18 |
Συλλογή
|
Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Διδακτορικές διατριβές
|
|
Τύπος Εργασίας--Διδακτορικές διατριβές
|
Μόνιμη Σύνδεση |
https://elocus.lib.uoc.gr//dlib/3/3/0/metadata-dlib-1647937022-963858-8928.tkl
|
Εμφανίσεις |
722 |