COllaboration, CLassification, Incrémentalité et COnnaissances

COllaboration, CLassification, Incrémentalité et COnnaissances

Objectifs

De COllaboration, CLassification, Incrémentalité et COnnaissances
Révision datée du 19 novembre 2012 à 23:44 par Pgancarski (discussion | contributions) (Révocation des modifications de Agf (discussion) vers la dernière version de 130.79.182.146)
Aller à la navigation Aller à la recherche

Objectifs et verrous scientifiques et techniques

Pour résoudre les défis présentés ci-dessus, le projet propose des objectifs et des verrous scientifiques plus spécifiques. Ils consistent entre autres :

  1. à concevoir un modèle de processus générique collaboratif multistratégie multi-échelle. Le projet Coclico se focalisera entre autres sur trois verrous scientifiques :
    • le premier verrou scientifique porte sur la définition d’un ou plusieurs objectifs compatibles avec les différents paradigmes d’analyse (classification, clustering, segmentation, etc.) ainsi que d’un ou plusieurs critères de d’évaluation de la qualité des résultats (c’est-à-dire de la qualité finale de la collaboration) par rapport à ces objectifs ;
    • le deuxième verrou est lié aux mécanismes de collaboration à mettre en œuvre pour les améliorer, ainsi que sur la définition du résultat unifiant les différents résultats intermédiaires et finaux (vote simple, théorie des croyances…) ;
    • le troisième verrou porte sur les critères de comparaison et d’évaluation mutuelle de différents résultats intermédiaires. En effet, afin de d’évaluer et guider la collaboration, il sera nécessaire de comparer les différents résultats de classification élémentaire et donc de définir une mesure « multi points de vue » afin estimer leur similarité.
  2. à proposer des mécanismes et méthodes permettant un apprentissage incrémental. Le projet Coclico se focalisera entre autres sur trois verrous scientifiques :
    • le premier verrou porte sur le contrôle de la mémoire du passé pour régler de manière optimale le compromis entre la réactivité aux changements potentiels et la précision de l’hypothèse courante. Ce compromis n’a pas, à l’heure actuelle, de solution générale. Mais il faudra de plus le réaliser dans le cadre de méthodes collaboratives mettant en jeu des « experts » de nature différente et utilisant des données variées ;
    • le deuxième verrou concerne la gestion d’experts de types différents travaillant sur des données diverses et de qualité pouvant varier au cours du temps. L’objectif est de mesurer à chaque instant l’apport (ou la perte) en terme de qualité de prédiction et d’interprétabilité des résultats engendrée par la prise en compte d’un expert ou d’une source de données afin de configurer optimalement la collaboration entre experts. La prise en compte adaptative de critères de qualité multi-variés est un problème nouveau. Des mécanismes d’optimisation multi-objectifs devront être explorés ;
    • le troisième verrou lié au travail collaboratif et en-ligne entre experts porte sur les échanges d’information entre ces experts. Puisque ces experts sont différents, utilisent des données diverses et émettent des hypothèses de niveaux éventuellement différents, il est nécessaire d’adapter les informations qu’ils échangent pour collaborer. Il faudra en particulier s’appuyer sur les travaux récents d’apprentissage par transfert pour résoudre ce problème.
  3. à proposer des mécanismes permettant d’intégrer la prise en compte de connaissances avant, pendant et après le processus d’apprentissage. Le projet Coclico se focalisera entre autres sur deux verrous scientifiques :
    • le premier verrou scientifique réside dans la nécessité de définir des mécanismes générique de prise en compte de connaissances indépendamment des méthodes de classification élémentaires mises en œuvre. Cela nécessitera aussi la détermination des différents types de connaissances utilisables ou contraintes applicables lors du processus. Il porte aussi sur la définition de critères d’évaluation de la qualité de prise en compte de la connaissance et du respect des contraintes ;
    • e deuxième verrou scientifique est lié la nécessité de normaliser et formaliser les connaissances de l’expert en tenant compte du fait que la base de connaissances à construire est à la croisée de deux domaines de connaissances : les connaissances sur le domaine applicatif et les connaissances sur les limitations et les possibilités des outils de reconnaissance et d’extraction des objets à partir des données. De plus, elle se doit d’être opérable dans le processus collaboratif de classification et s’enrichir des analyses effectuées, de l’utilisation du processus et de l’apport de nouvelles connaissances par l’expert.
  4. à définir des moyens, d’une part d’évaluer la qualité des données considérées et de préconiser des stratégies de prétraitement devant satisfaire les contraintes imposées par les analyses collaboratives et, d’autre part, d’évaluer la qualité des résultats produits. Pour cela, il est nécessaire de s’intéresser aux différentes méthodes de détection de données aberrantes et à celles de dérive de concept, toutes rendues d’autant plus complexes qu’elles doivent se faire à différents niveaux de granularité temporelle et spatiale. Le projet Coclico se focalisera entre autres sur les deux verrous scientifiques:
    • le premier verrou concerne la corroboration des résultats des méthodes d’évaluation de la qualité : en effet, plusieurs méthodes n’auront pas la même sensibilité dans leur détection des anomalies dans un jeu de données et il s’agira de proposer une approche permettant de réaliser un profilage automatique des jeux de données en entrée avec l’ensemble des méthodes de détection disponibles et de corroborer leurs résultats afin d’avoir une vue unifiée des problèmes de qualité dans les données utilisées. De façon similaire, pour l’évaluation des connaissances, une multiplicité de méthodes retournant des résultats parfois contradictoires est disponible pour évaluer des connaissances. Nous proposons une méthode pour unifier l’évaluation par la corroboration des méthodes ;
    • le deuxième verrou méthodologique concerne l’évaluation des connaissances en sortie des algorithmes de fouille : les approches actuelles n’intègre pas la qualité des données en entrée pour qualifier les connaissances en sortie. L’objectif étant de s’affranchir de la variabilité et des impacts du prétraitement. Dans notre approche au contraire, les stratégies de prétraitement, tout comme les stratégies de collaboration ont un impact direct à la fois sur la qualité des données analysées et bien évidemment sur la qualité des résultats en sortie. L’étude et l’optimisation de ces stratégies pour garantir la qualité en sortie sont au cœur de notre projet.
  5. Un dernier objectif, plus applicatif (thématique), est d’adapter la méthodologie semi-automatique proposée à l’extraction des formes géographiques (urbaines, paysagères, etc.) à partir de données hétérogènes :
    • Les travaux utilisant les images à différentes résolutions spatiales, spectrales et temporelles, se sont multipliés ces dernières années et sont principalement fondés sur une classification orientée-objet. En dépit de quelques solutions déjà proposées par des recherches antérieures [For08] l’extraction des objets, et leur mise à jour automatique à partir d’images satellites reste un premier verrou scientifique spécifique au domaine à dépasser.
    • Les données issues des BD ne sont pas encore suffisamment et réellement utilisées alors qu’elles détiennent des informations (géométrie, relations contextuelles entre objets) qui peuvent être exploitées pour créer des connaissances utilisables dans le processus d’analyse. Un deuxième verrou scientifique spécifique au domaine réside dans la nécessité de définir des mécanismes permettant de relier, unifier et utiliser des sources de données hétérogènes lors de la production de connaissances mais aussi directement dans le processus de classification.

Enfin, un verrou technologique se pose afin de rendre la base de connaissances, les méthodologies, les méthodes et les indicateurs interopérables et compatibles avec les infrastructures existantes dans lesquelles ils pourraient être diffusés à l’issue de ce projet.