Analyse exploratoire : Data mining

Analyse exploratoire : Data mining


Analyse exploratoire : Date mining, les pré-requis

Afin de prendre en compte le rôle des variables explicatives de façon pertinente, le chantier a été utilisé comme niveau élémentaire de référence. En effet, les variables explicatives sont toutes relatives au chantier lui-même et par conséquent, l’utilisation de chaque mesure entraînerait un biais. De ce fait, un paramètre synthétique (agrégateur) a du être utilisé. Pour des raisons de pertinence et de lisibilité, la moyenne arithmétique a été retenue. Ainsi, les données utilisées dans le cadre des analyses qui suivent comptent 71 lignes et 47 variables explicatives. La variable cible envisagée dans la suite est la somme des concentrations en fibres d’amiante OMS et FFA. La cible a été discrétisée selon les critères fournis dans le protocole :

- Concentration faible, notée 0F lorsque C < 1000 f/l
- Concentration moyenne, notée 1M lorsque 1000 f/l < C < 10000 f/l
- Concentration élevée, notée 0E lorsque C > 10000 f/l