Outils personnels

Vous êtes ici : Accueil / PHC Utique franco-tunisien / Projets en cours / Intégration de masses de données en utilisant les workflows sémantiques en environnements cloud

Intégration de masses de données en utilisant les workflows sémantiques en environnements cloud

PHC : Utique
Codes du projet : 15G1413 -- Campus N° 32841XK
Domaine : Mathématiques - Sciences et technologies de l'information (STIC)
Intitulé : Intégration de masses de données en utilisant les workflows sémantiques en environnements cloud
Porteur(s) : GRIGORI Daniela, BELLAMINE BEN SAOUD Narjès, BOUZEGHOUB Amel, JMAIEL Mohamed
Date de début : 01/01/2015
Date de fin : 31/12/2017

L’intégration de données a été pendant les trois dernières décennies un champs de recherche actif [HRO06]. Un système
d’intégration de données est, souvent composé de quatre éléments à savoir, les schémas des sources de données, les
ensembles de données à intégrer, un schéma d'intégration à travers lequel les utilisateurs posent des requêtes, et des mappings
de schéma qui spécifient comment les données structurées dans les schémas des sources peuvent être transformées et
combinées en données structurées selon le schéma d'intégration.
Alors que de tels systèmes ont fait leur preuve pour l’intégration de sources de données de petite ou moyenne taille, ils ont des
limites quand il s’agit d’intégrer de grandes masses de données surtout si celles-ci sont hétérogènes et multimédias (images,
vidéos, etc.). En effet, aujourd’hui les données sont produites à une vitesse qui dépasse largement les capacités et fonctionnalités
offertes par les systèmes traditionnels d’intégration de données. Par exemple, dans de nombreux domaines: scientifiques (e.g.,
cartographie du génome et astronomie) et sociétaux (e.g., réseaux sociaux, bibliothèques numériques, gestion de catastrophes)
des volumes de données considérables sont produites.
Dans un tel contexte, nous devons explorer de nouvelles méthodes et techniques pour l’intégration de grandes masses de
données dans le but d’assurer leur gestion et leur exploration. Nous allons explorer dans ce projet l’utilisation de la technologie
workflow couplée par l’utilisation des infrastructures type cloud pour faire face à l’intégration de masses de données.

Objectifs

L’intégration de données a été pendant les trois dernières décennies un champs de recherche actif [HRO06]. Un système
d’intégration de données est, souvent composé de quatre éléments à savoir, les schémas des sources de données, les
ensembles de données à intégrer, un schéma d'intégration à travers lequel les utilisateurs posent des requêtes, et des mappings
de schéma qui spécifient comment les données structurées dans les schémas des sources peuvent être transformées et
combinées en données structurées selon le schéma d'intégration.
Alors que de tels systèmes ont fait leur preuve pour l’intégration de sources de données de petite ou moyenne taille, ils ont des
limites quand il s’agit d’intégrer de grandes masses de données surtout si celles-ci sont hétérogènes et multimédias (images,
vidéos, etc.). En effet, aujourd’hui les données sont produites à une vitesse qui dépasse largement les capacités et fonctionnalités
offertes par les systèmes traditionnels d’intégration de données. Par exemple, dans de nombreux domaines: scientifiques (e.g.,
cartographie du génome et astronomie) et sociétaux (e.g., réseaux sociaux, bibliothèques numériques, gestion de catastrophes)
des volumes de données considérables sont produites.
Dans un tel contexte, nous devons explorer de nouvelles méthodes et techniques pour l’intégration de grandes masses de
données dans le but d’assurer leur gestion et leur exploration. Nous allons explorer dans ce projet l’utilisation de la technologie
workflow couplée par l’utilisation des infrastructures type cloud pour faire face à l’intégration de masses de données.

Résultats

Le but principal de ce projet est de proposer une solution complète pour la spécification, le déploiement, l’exécution et le monitoring des workflows d’intégration de masses de données en environnements Cloud. Ce faisant, nous allons couvrir le cycle de vie des workflows d’intégration de données. Par conséquent, nous détaillons le but ci-dessus selon les quatre objectifs complémentaires suivants:
Mettre en oeuvre une méthodologie pour la conception des workflow d’intégration de données en utilisant et exploitant des
annotations sémantiques pour guider le concepteur.
Elaborer des techniques pour faciliter le déploiement de tels workflows en environnements Cloud en prenant en compte en particulier l’allocation des ressources nécessaires pour l’exécution de workflow.
Proposer des techniques pour permettre la supervision, l’exécution et l’adaptation de workflows sémantiques en environnements Cloud.
Diriger le travail et valider les résultats obtenus à travers des études de cas concrètes.

Informations supplémentaires

Telecom SudParis

Partenaire français
Evry
http://www.telecom-sudparis.eu/fr_accueil.html

Laboratoire(s) ou unité(s) de recherche
Services Répartis, Architectures, Modélisation, Validation, Administration des Réseaux (SAMOVAR)


Responsable(s)
Amel BOUZEGHOUB - Laboratoire SAMOVAR - Evry - Tél :0160764714 - Email :Amel.Bouzeghoub@it-sudparis.eu

CNRS - UMR 7243/Université Université Paris-Dauphine

Partenaire français
Paris
http://www.lamsade.dauphine.fr/

Laboratoire(s) ou unité(s) de recherche
Laboratoire d'Analyse et Modélisation de Systèmes pour l'Aide à la Décision (LAMSADE)


Responsable(s)
Daniela GRIGORI - Laboratoire LAMSADElao - Paris - Tél :0144054508 - Email :daniela.grigori@dauphine.fr

Ecole Nationale des Sciences de l'Informatique

Partenaire tunisien
Manouba
http://www.ensi.rnu.tn/fr/

Laboratoire(s) ou unité(s) de recherche
Laboratoire de Recherche en Génie logiciel, Applications Distribuées, Systèmes Décisionnels et Imagerie intelligente (RIADI)


Responsable(s)
Narjès BELLAMINE BEN SAOUD - Laboratoire RIADI - Manouba - Tél :98964565 - Email :narjes.bellamine@ensi.rnu.tn

Ecole Nationale des Sciences de l'Informatique

Partenaire tunisien
Sfax
http://www.enis.rnu.tn/

Laboratoire(s) ou unité(s) de recherche
Laboratoire de Recherche en Développement et Contrôle d’Applications Distribuées (ReDCAD)


Responsable(s)
Mohamed JMAIEL - Laboratoire ReDCAD - Sfax - Tél :0021674278777