Méthodologie

Méthodologie


Méthodologie

La technique mise en œuvre repose sur une structure mathématique rigoureuse et lisible : les réseaux bayésiens (Naim et Wuillemin, 2007). Les algorithmes d’apprentissage automatique supervisés et non supervisés rapides et performants reposent sur le principe de parcimonie (rasoir d’Occam) qui permet de construire des modèles pertinents et qui offrent un bon équilibre intrinsèque entre la concision du modèle et l’adéquation aux données. Pour ce faire, le score Minimum Description Length est utilisé. De plus, des traitements pertinents des données manquantes et inexistantes sont disponibles. Ces traitements reposent sur l’algorithme Expectation- Maximization qui consiste à simuler la donnée manquante par la distribution des autres valeurs existantes. L’analyse se déroule en deux temps :

- Premièrement, une analyse non supervisée, dont l’objectif est d’extraire des motifs dans l’organisation et les caractéristiques intrinsèques du chantier, sans exploiter le résultat de l’analyse de la concentration ;

- Deuxièmement, une analyse supervisée, dont l’objectif est d’expliquer au mieux la concentration en fibres d’amiante OMS+FFA avec les variables explicatives disponibles.