img-logoENSRennes-soutenanceMatthieuDorier

High-Performance Big Data Management Across Cloud Data Centers

img-soutenanceTheseMatthieuDorier2014 Radu Tudoran - Inria (KerData)

PhD defense - Wednesday 10th december 2014

The talk [45:28 mn]

Downloading File (MP4)

img-logoPdfpetitetaille The slides
img-logoPdfpetitetaille Thesis defense report
Index des soutenances de thèse

Composition du Jury:

• Frédéric Desprez / rapporteur - Directeur de recherche, Inria Rhône-Alpes, France
• Michael Schöttner / rapporteur et examinateur - Professor, Institute of Informatics, Duesseldorf University, Germany
• Pierre Sens / examinateur - Professeur, Université Paris 6, France
• Olivier Nano / examinateur - Principal Development Manager at Microsoft Research, ATLE, Germany
• Patrick Valduriez / examinateur - Directeur de recherche, Inria Sophia Antipolis-Méditerranée, France
• Gabriel Antoniu / directeur de thèse - Directeur de recherche, Inria Rennes - Bretagne Atlantique, France
• Luc Bougé / directeur de thèse - Professeur, ENS Rennes, France

Résumé:

La puissance de calcul facilement accessible offerte par les infrastructures clouds, couplés à la révolution du "Big Data", augmentent l'échelle et la vitesse auxquelles l'analyse des données est effectuée. Les ressources de cloud computing pour le calcul et le stockage sont répartis entre plusieurs centres de données de par le monde. Permettre des transferts de données rapides devient particulièrement important dans le cadre d'applications scientifiques pour lesquels déplacer le traitement proche de données est coûteux voire impossible. Les principaux objectifs de cette thèse consistent à analyser comment les clouds peuvent devenir "Big Data - friendly", et quelles sont les meilleures options pour fournir des services de gestion de données aptes à répondre aux besoins des applications. Dans cette thèse, nous présentons nos contributions pour améliorer la performance de la gestion de données pour les applications exécutées sur plusieurs centres de données géographiquement distribués. Nous commençons avec les aspects concernant l'échelle du traitement de données sur un site, et poursuivons avec le développement de solutions de type MapReduce permettant la distribution des calculs entre plusieurs centres. Ensuite, nous présentons une architecture de service de transfert qui permet d'optimiser le rapport coût-performance des transferts. Ce service est exploité dans le contexte de la diffusion de données en temps-réel entre des centres de données de clouds. Enfin, nous étudions la viabilité, pour un fournisseur de cloud, de la solution consistant à intégrer cette architecture comme un service basé sur un paradigme de tarification flexible, qualifiée de "Transfert-as-a-Service".

img-logoFlecheHaut