logo-UniversitéRennes1 logo-InriaRennes logo-Irisa

Mining and Modeling Variability from Natural language Documents:
Two Case Studies

Extraction automatique de modèles de variabilité à partir de documents en langage naturel: deux études de cas.

Sana Ben Nasr

(team-project DiverSE)

PhD defense - 5th April 2016

Sous la direction de Benoit Baudry and Mathieu Acher

L'exposé [46:07 mn]
img-logoPdfsmall Les transparents (pdf)
Le Jury
Le résumé
index vidéo des soutenances de thèse

img-exposeSoutenanceLeCui2016

Cliquer sur l'image pour lancer la vidéo (fichier téléchargeable (MP4) img-flecheHAUT

Les membres du Jury:

HUCHARD Marianne - Professeur, Université de Montpellier, France
SALINESI Camille - Professeur, Université de Paris, France
SABETZADEH Mehrdad - Senior Research Scientist, Snt Centre for Security, Luxembourg
SEBILLOT Pascale - Professeur, Université de Rennes 1, France
ACHER Mathieu - Maitre de conférence, Université Rennes 1, France
BAUDRY Benoit - Chercheur, INRIA, France (directeur de thèse)

img-flecheHAUT

Résumé:

L'analyse du domaine vise à identifier et organiser les caractéristiques communes et variables dans un domaine. Dans la pratique, le coût initial et le niveau d'effort manuel associés à cette analyse constituent un obstacle important pour son adoption par de nombreuses organisations qui ne peuvent en bénéficier. La contribution générale de cette thèse consiste à adopter et exploiter des techniques de traitement automatique du langage naturel et d'exploration de données pour automatiquement extraire et modéliser les connaissances relatives à la variabilité à partir de documents informels.

L'enjeu est de réduire le coût opérationnel de l’analyse du domaine. Nous étudions l'applicabilité de notre idée à travers deux études de cas pris dans deux contextes différents: (1) la rétro-ingénierie des Modèles de Features (FMs) à partir des exigences réglementaires de sûreté dans le domaine de l’industrie nucléaire civil et (2) l’extraction de Matrices de Comparaison de Produits (PCMs) à partir de descriptions informelles de produits. Dans la première étude de cas, nous adoptons des techniques basées sur l’analyse sémantique, le regroupement des exigences et les règles d'association. Dans la deuxième étude de cas, notre approche repose sur la technologie d'analyse contrastive pour identifier les termes spécifiques au domaine à partir du texte, l'extraction des informations pour chaque produit, le regroupement des termes et le regroupement des informations.

La principale leçon à tirer de ces deux études de cas, est que l’extraction et l’exploitation de la connaissance relative à la variabilité dépendent du contexte, de la nature de la variabilité et de la nature du texte.

img-logoFlecheHaut
© 2016 Pôle audiovisuel Inria Rennes-Bretagne Atlantique