Groupe de
travail sur
les données semi-structurées
Membres :
Sophie Tison
Yves André
Anne-Cécile Caron
Yves Roos
Denis Debarbieux
On appelle données semi-structurées des données
qui n'ont
pas de schéma a priori mais plutôt dont le schéma
peut-être
extrait à partir de la donnée. Des exemples de telles
données
sont les documents XML(pour lesquels un schema n'est pas obligatoire),
ou plus largement l'ensemble des documents qui constituent
un site Web ainsi que les liens permettant de passer de l'un à
l'autre. Nous sommes particulièrement intéressés
par les contraintes de chemins qui peuvent exister à
l'intérieur de telles données.
Tout d'abord, nous avons étudié la construction d'un
modèle associé à une donnée
semi-structurée qui préserve (totalement ou le mieux
possible) le langage des chemins présents dans cette
donnée. Parmi les modèles étudiés, notre
intérêt a porté sur les modèles de graphes
qui conservent certaines informations sur la structure de la
donnée, exprimées sous forme de contraintes d'inclusions.
D'autre part, nous étudions des algorithmes de décisions
de propriétés liées à ces contraintes,
comme la "boundedness property" ou encore
l'implication de contraintes. Notre approche est basée sur
l'utilisation d'outils formels que sont les automates ou les
systèmes de réécriture.
Nous voulons étudier l'utilisation de ces contraintes dans le
cadre de l'optimisation de requêtes, et en particulier la
réécriture de requêtes
en utilisant des vues matérialisées et des contraintes.
Nous travaillons en collaboration avec l'équipe Grappa de
l'université de Lille III, dans le projet INRIA MOSTRARE.