Telecom Paris
Dep. Informatique & Réseaux

J-L. Dessalles Home page

April 2020



    Projet
                             See also:    Artificial Intelligence courses
                             À lire:    Recommandations pour la réalisation d’un projet

    

projet P.A.F

Projet proposé par J-L. Dessalles (dessalles [at_] telecom-paris.fr)

Interaction en langue naturelle avec une base de données
Interacting with a database in natural language

L’objectif est de permettre à un utilisateur occasionnel d’utiliser et de gérer une petite base de données en s’exprimant de manière naturelle.
Par exemple: Cette étude vise à concevoir un programme générique, facilement adaptable à n’importe quelle base de données, et transposable à d’autres types d’interactions sous forme de commandes (par ex. système de gestion de fichiers, pilotage de commandes système).

Le dernier exemple ("marque les commandes anormales") suppose un petit travail sur la détection d’anomalies.

Description

Il s’agit d’un projet d’intelligence artificielle. L’objectif est d’amener la machine à réaliser des actions qu’elle comprend, tout en levant les ambiguïtés éventuelles. Ces ambiguïtés peuvent provenir de l’emploi d’expressions imprécises comme "affiche les clients récents", de l’ambiguïté des données, par exemple "coche Dupont" dans le cas où plusieurs enregistrements correspondent à Dupont, ou encore de l’ambiguïté de l’action à effectuer, comme dans "supprime les enregistrements en double" (où il faut comprendre: une seule suppression par paire).

Un second objectif, relativement indépendant du premier, consiste à analyser les données de la base pour en extraire des prototypes. Cette analyse permet d’une part de repérer les situations anormales (par ex. "un client qui a dépensé 10 fois plus que normalement") et d’autre part de fournir des descriptions optimales ("c’est un client qui a dépensé énormément"). Ces deux aspects reposent sur l’application d’un principe MDL (minimal description length). L’intérêt de cette analyse des données est de permettre à la machine de prendre l’initiative dans le dialogue en repérant les situations anormales et en lui permettant de décrire les objets de la base d’une manière plus "humaine".

Travail envisagé

Le projet est adaptable dans une certaine mesure aux préférences et aux compétences des étudiants. Il pourra être orienté vers une sélection des tâches suivantes, qui donnent une indication du travail attendu.

Réalisation

Le langage de programmation est Python. Le projet sera réalisé de manière incrémentale. Une attention particulière sera portée sur: