Big data

Elèves ingénieurs : Carl-Emmanuel et Serigne, département Génie Informatique et Statistique

Mission : analyser les données variées et dispersées d’une entreprise pour proposer leur intégration dans une base de données NoSQL sans remettre en question les outils et approches utilisés

Contexte : le projet a été proposé par Maia Eolis, une filiale d’ENGIE qui gère des parcs éoliens. Chaque éolienne envoie un grand nombre d’information par exemple sur la force et la direction du vent, toutes les 10 minutes. Ces informations sont analysées pour mieux comprendre la production d’énergie en fonction de nombreux paramètres et anticiper les pannes. Il a été possible de réduire l’intervalle de temps entre deux envois à 1 seconde. Les données à traiter sont donc beaucoup plus nombreuses. Les outils statistiques traditionnels ne sont plus adaptés. Par ailleurs, les données à analyser ne proviennent pas seulement des éoliennes mais aussi d’autres sources d’information. Ce projet a pour but de fusionner l’ensemble des données pour faciliter la corrélation d’information de sources diverses, comme par exemple “est ce que la météo ET certaines opérations de maintenance ont un impact sur la durée de vie de certains équipements ?”. Le travail des étudiants a consisté à analyser les différents référentiels d’information et bases de données associées afin de proposer une chaîne de duplication dans une seule base NoSQL.

Résultat : les élèves ont proposé une architecture à plusieurs niveaux par l’importation automatique des données sous différentes formes, puis leur normalisation (nécessaire par la variété des données mais aussi par leur évolution au cours des années). Il reste encore à démontrer la compatibilité avec les outils existants par le portage de plusieurs programmes de statistiques pour interroger cette nouvelle plate-forme.