UPS

Caractérisation de visualisations et exploration interactive de grandes quantités de données multidimensionnelles.

Christophe Hurter
Université Paul Sabatier - Toulouse III.
2010

Aerospace Valley best PhD thesis award 2011



Directeur: Philippe PALANQUE, UPS, LIIHS/IRIT
Co-directeur : Stéphane CONVERSY, ENAC, LIIHS/IRIT
Localisation : DSNA/DTI/R&D, ENAC/LII, LIIHS/IRIT
Phd : 8th July 2010


Mots-clés  :
----------------
IHM, InfoVis, Design, Caractérisation, Exploration de données, Contrôle Aérien.

Composition du jury :
---------------------------
Jean-Daniel FEKETE : Directeur de recherche, INRIA Centre de Recherche Saclay - Île-de-France. Rapporteur.
Pourang IRANI : Associate Professor, University of Manitoba Canada. Rapporteur.
Florence SEDES : Professeur à l’UPS. Présidente.
Guy MELANCON : professeur, université de Bordeaux. Examinateur.
Renaud BLANCH : maître de conférences, Université de Grenoble. Examinateur.
Stéphane CONVERSY : Enseignant chercheur à l’ENAC. Directeur de thèse.
Philippe PALANQUE : Professeur à l’IRIT. Directeur de thèse.

Abstract :
------------

A great number of activities use IS (Information Systems) relying on interactive graphic visualizations. As a vector for the transmission of information, these visualizations aim at optimizing the bandwidth between the user and the visual information. To create effective visualizations, designers use methods based on their expertise and user tests. These methods affect the design process, they are time consuming, and they do not rely on specific detailed theories, which could avoid, in advance, errors of conception. In order to better study these visualizations, we propose to characterize them, which means to systematically number and define their properties explaining all the visual phenomena that enable transmission of information. The thesis that we hold to, consists in saying that the characterization of a visualization is important for their conception, and that their exploitation in the light of these methods and tools enable the creation of better interactive systems.
Thus, we have determined that a characterization is composed of two elements: its contents and the way in which its content take form. We will show that the DataFlow model, a model that usually permits the description of the construction of the visualization, does not accomplish a sufficiently complete characterization. We will propose other models enabling characterization of the dynamic aspects, emerging information (notably those issuing from so-called “ecological” design) and especially graphic accumulation. In using visualization issuing from the milieu of air transportation, we will show how the characterization enables the understanding of their similarities and differences, to remove the ambiguities from the communication between designers and to conceive of, for example, a new schematic visualization of air routes. In addition, we have adapted the process to transform a collection of data into a visualization in the form of an exploration software of large numbers of multidimensional data. This software relies notably on an exploration of visual configuration and on a collection of original interactions with powerful implementation. FromDaDy (From Data to Display) enables the configuration and manipulation, in real-time, of rich and original visualizations, such as those using graphical accumulation

 

Résumé :
------------

Un grand nombre d’activités utilise des outils informatisés s’appuyant sur des représentations graphiques interactives. En tant que vecteurs de transmission d’informations, ces visualisations visent à optimiser la bande passante entre le visuel et l’utilisateur. Pour créer des visualisations efficaces, les concepteurs utilisent des méthodes basées sur leur expertise et sur des tests utilisateurs. Ces méthodes altèrent le processus de design : elles sont chronophages et ne reposent pas sur des fondements théoriques précis qui pourraient éviter des erreurs de conception en amont. Afin de mieux étudier les visualisations, nous proposons de les caractériser, c'est-à-dire d'en énumérer et d’en définir systématiquement les propriétés, tout en explicitant les phénomènes visuels qui engendrent la transmission d'informations. La thèse que nous soutenons consiste à dire que la caractérisation des visualisations est importante pour leurs conceptions, et que son opérationnalisation par des méthodes et des outils permet de concevoir de meilleurs systèmes interactifs.
Ainsi, nous avons déterminé qu'une caractérisation est composée de deux éléments : son contenu et sa mise en forme. Nous montrons que le modèle de Data Flow, modèle usuel permettant la description de la construction de visualisations, ne permet pas de les caractériser. Nous proposons d'autres modèles qui permettent de caractériser l'aspect dynamique, les informations émergentes (et notamment celles issues des visualisations dites "écologiques"), ainsi que l'accumulation graphique. En utilisant des visualisations issues du milieu du transport aérien, nous montrons comment la caractérisation permet de comprendre leurs similitudes et leurs différences, de lever les ambiguïtés de communication entre concepteurs, et de concevoir, par exemple, une nouvelle visualisation schématique de routes aériennes. Enfin, nous avons réifié le processus de transformation d'un ensemble de données vers une visualisation sous la forme d’un logiciel d’exploration et de visualisation de grandes quantités de données multidimensionnelles : From Data To Display (FromDaDy). Ce logiciel s'appuie notamment sur l'exploration des configurations visuelles, et sur un ensemble d'interactions originales avec une implémentation performante. FromDady permet de configurer et de manipuler en temps réel des visualisations riches et originales, comme celles utilisant l'accumulation.