La discrimination entre les formations hydrogéologiques à fort potentiel en eau est importante pour une bonne gestion des ressources en eau, mais aussi pour une prise de décision rapide, par exemple en cas de pollution accidentelle. Le but de cette étude est la comparaison de méthodes mathématiques pour la discrimination de deux formations hydrogéologiques (de roches vertes et grès Tarkwaïens d’une part et de granitoïdes d’autre part), sur la base de leurs caractéristiques physico chimiques sur la commune de Markoye. La distribution des fréquences de valeurs, prises individuellement ou ensemble par la classification hiérarchique ascendante non supervisée ne permet pas de discriminer les deux aquifères. La combinaison linéaire des paramètres par exemple par une régression linéaire multiple permet en revanche de mieux différencier l’origine des eaux selon leur aquifère d’origine. Le passage à une approche multi paramètres non linéaire (parabolique) n’apporte pas de réelle amélioration. L’hypothèse de linéarité ne constitue pas une contrainte dans le cas étudié. Ainsi, ce ne sont pas les valeurs des différents paramètres qui différencient les caractéristiques des deux formations hydrogéologiques, mais plutôt les relations liant les paramètres. Que ce soit pour l’ensemble des données ou bien pour chacun des deux formations hydrogéologiques pris individuellement, le premier axe factoriel de l’Analyse en Composantes Principales représente la minéralité des eaux. Ce qui différencie les deux formations hydrogéologiques c’est l’origine de la minéralité. Pour les formations hydrogéologiques de roches vertes et ensembles de grès Tarkwaïens la minéralisation résulte principalement de l’altération de roches et accessoirement de la pollution domestique. Pour l’aquifère des granitoïdes en revanche la pollution domestique avec les différentes formes azotées joue un rôle déterminant dans la minéralisation, l’altération des roches étant secondaire. L’Analyse Discriminante donne de bons résultats pour discriminer les formations hydrogéologiques. Son inconvénient réside dans le fait que le jeu de données utilisé pour la recherche d’une fonction linéaire discriminante est aussi utilisé pour mesurer les performances de la discrimination. Les méthodes de Machines Learning issues des techniques récentes de Big Data ne présentent pas cet inconvénient et elles ne sont pas forcément limitées à des approches linaires. Deux de ces techniques (Naive Bayes Classifier et K Nearest Neighbors) ont été testées sur ce jeu de données. Elles permettent une discrimination réelle, mais moins performante que l’analyse discriminante. La raison est que l’apprentissage n’est pas effectué sur la totalité du jeu de donnée mais sur une partie seulement, ce qui réduit les performances. En revanche, l’évaluation des performances est plus fiable, que pour l’analyse discriminante qui constitue une méthode de référence.
Formations hydrogéologiques, minéralisation, ACP, Analyse discriminante, Classification hiérarchique, Hydrochimie, Commune de Markoye