Groupe de travail sur les données semi-structurées

Membres :

Sophie Tison
Yves André
Anne-Cécile Caron
Yves Roos
Denis Debarbieux


On appelle données semi-structurées des données qui n'ont pas de schéma a priori mais plutôt dont le schéma peut-être extrait à partir de la donnée. Des exemples de telles données sont les documents XML(pour lesquels un schema n'est pas obligatoire), ou plus largement l'ensemble des documents qui constituent un site Web ainsi que les liens permettant de passer de l'un à l'autre. Nous sommes particulièrement intéressés par les contraintes de chemins qui peuvent exister à l'intérieur de telles données.

Tout d'abord, nous avons étudié la construction d'un modèle associé à une donnée semi-structurée qui préserve (totalement ou le mieux possible) le langage des chemins présents dans cette donnée. Parmi les modèles étudiés, notre intérêt a porté sur les modèles de graphes qui conservent certaines informations sur la structure de la donnée, exprimées sous forme de contraintes d'inclusions.
D'autre part, nous étudions des algorithmes de décisions de propriétés liées à ces contraintes, comme la "boundedness property" ou encore
l'implication de contraintes.  Notre approche est basée sur l'utilisation d'outils formels que sont les automates ou les systèmes de réécriture.
Nous voulons étudier l'utilisation de ces contraintes dans le cadre de l'optimisation de requêtes, et en particulier la réécriture de requêtes
en utilisant des vues matérialisées et des contraintes.


Nous travaillons en collaboration avec l'équipe Grappa de l'université de Lille III, dans le projet INRIA MOSTRARE.