|
Κωδικός Πόρου |
000406909 |
Τίτλος |
Difference analysis in big data : exploration, explanation, evolution |
Άλλος τίτλος |
Analyse de différences dans le big data: exploration. explication, évolution |
|
Ανάλυση διαφορών σε μεγάλα δεδομένα: εξερεύνηση, εξήγηση, εξέλιξη |
Συγγραφέας
|
Κλεισαρχάκη, Σοφία Ι.
|
Σύμβουλος διατριβής
|
Χριστοφίδης, Βασίλειος
Amer-Yahia, Sihem
|
Περίληψη |
La Variabilité dans le Big Data se réfère aux données dont la signification change de manière
continue. Par exemple, les données des plateformes sociales et les données des applications
de surveillance, présentent une grande variabilité. Cette variabilité est dûe aux différences
dans la distribution de données sous-jacente comme l’opinion de populations d’utilisateurs
ou les mesures des réseaux d’ordinateurs, etc. L’Analyse de Différences a comme objectif
l’étude de la variabilité des Données Massives. Afin de réaliser cet objectif, les data scientists
ont besoin (a) de mesures de comparaison de données pour différentes dimensions telles
que l’âge pour les utilisateurs et le sujet pour le traffic réseau, et (b) d’algorithmes efficaces
pour la détection de différences à grande échelle. Dans cette thèse, nous identifions et
étudions trois nouvelles tâches analytiques :
L’Exploration des Différences, l’Explication des Différences et l’Evolution des Différences.
L’Exploration des Différences s’attaque à l’extraction de l’opinion de différents segments
d’utilisateurs (ex., sur un site de films). Nous proposons des mesures adaptées à la comparaison de distributions de notes attribuées par les utilisateurs, et des algorithmes efficaces
qui permettent, à partir d’une opinion donnée, de trouver les segments qui sont d’accord ou
pas avec cette opinion. L’Explication des Différences s’intéresse à fournir une explication
succinte de la différence entre deux ensembles de données (ex., les habitudes d’achat de
deux ensembles de clients). Nous proposons des fonctions de scoring permettant d’ordonner
les explications, et des algorithmes qui guarantissent de fournir des explications à la fois
concises et informatives. Enfin, l’Evolution des Différences suit l’évolution d’un ensemble
de données dans le temps et résume cette évolution à différentes granularités de temps. Nous
proposons une approche basée sur le requêtage qui utilise des mesures de similarité pour
comparer des clusters consécutifs dans le temps. Nos index et algorithmes pour l’Evolution
des Différences sont capables de traiter des données qui arrivent à différentes vitesses et
des types de changements différents (ex., soudains, incrémentaux). L’utilité et le passage à
l’échelle de tous nos algorithmes reposent sur l’exploitation de la hiérarchie dans les données
(ex., temporelle, démographique).
Afin de valider l’utilité de nos tâches analytiques et le passage à l’échelle de nos algo-
rithmes, nous réalisons un grand nombre d’expériences aussi bien sur des données synthé-
tiques que réelles.
Nous montrons que l’Exploration des Différences guide les data scientists ainsi que
les novices à découvrir l’opinion de plusieurs segments d’internautes à grande échelle.
L’Explication des Différences révèle la nécessité de résumer les différences entre deux
ensembles de donnes, de manière parcimonieuse et montre que la parcimonie peut être
atteinte en exploitant les relations hiérarchiques dans les données. Enfin, notre étude sur
l’Evolution des Différences fournit des preuves solides qu’une approche basée sur les requêtes
est très adaptée à capturer des taux d’arrivée des données variés à plusieurs granularités de
temps. De même, nous montrons que les approches de clustering sont adaptées à différents
types de changement.
|
Φυσική περιγραφή |
xiv, 116 σ. : πίν., εικ., σχεδ. ; 30 εκ. |
Γλώσσα |
Αγγλικά |
Θέμα |
Clustering algorithms |
|
Multi-dimensional data |
|
Αλγόριθμοι συσταδοποίησης |
|
Πολυδιάστατα δεδομένα |
Ημερομηνία έκδοσης |
2017-03-17 |
Συλλογή
|
Σχολή/Τμήμα--Σχολή Θετικών και Τεχνολογικών Επιστημών--Τμήμα Επιστήμης Υπολογιστών--Διδακτορικές διατριβές
|
|
Τύπος Εργασίας--Διδακτορικές διατριβές
|
Εμφανίσεις |
571 |