La data, véritable trésor du 21e siècle, peut être d’une valeur inestimable. Toutefois, pour en tirer pleinement profit, la collecte, le stockage ou encore l’analyse doivent avoir été bien pensés. Alors, comment optimiser l’utilisation de la donnée ? Comment transformer sa data en or ?
Conscientes de l’importance des données, de nombreuses entreprises et institutions récoltent à tout va, sans savoir vraiment quoi, ce que l’on peut en attendre et comment parvenir à faire de la data un élément stratégique précieux. Pour répondre à ces questions et à de nombreuses autres interrogations autour de la donnée, le groupe ENI (Editions ENI, ENI Service – Centre de Formation, ENI Ecole Informatique, ENI elearning) organisait mardi 23 avril 2024 le 5e ENI Talks “Transformez votre data en or : les clés pour réussir”.
Après, le Devops, l’IA pour les devs, la cybersécurité et le No-Code, le groupe ENI a souhaité mettre en lumière un élément fondamental dans (presque) tous les domaines de l’informatique d’aujourd’hui, la donnée ou data.
Pour aborder ce vaste sujet, cet ENI Talks, animé par Olivier Piers, directeur pédagogique de ENI école informatique, réunissait trois intervenants aux profils variés (monde du sport, de l’industrie, de la science) pour partager leurs expériences et conseils :
- Guillaume Saupin, executive partner et CTO de Verteego et auteur aux Editions ENI
- Marie Vaugoyeau, accompagnatrice indépendante à l’analyse de données et à la formation au langage R – Data scientist freelance et autrice aux Editions ENI
- Eric Alard, Responsable Relation Ecole-Entreprise à ENI Ecole informatique, conférencier et podcaster
Retrouvez ci-dessous le replay du webinaire :
🔍 Comme souvent, la première partie de ce Live a permis de bien délimiter le sujet. Car on confond souvent la mesure et la data qui, elle, intègre l’environnement de mesure, la population étudiée, etc. Au-delà de la différence entre données qualitatives et quantitatives, le distinguo données brutes – données propres fut particulièrement souligné, nos intervenants rappelant que le passage de l’une à l’autre était extrêmement important et un prérequis obligatoire avant l’analyse.
De même, les erreurs, biais, données manquantes ou inutiles doivent être repérés en s’appuyant notamment sur l’expertise métier.
Au cœur de nos débats et de la 2e partie, nos intervenants ont beaucoup insisté sur les objectifs que l’on se fixe pour exploiter la donnée. C’est une étape fondamentale car elle permet de ne pas récolter des datas inutiles ou inutilisables mais aussi de définir le périmètre (qui permet par exemple de voir que sur un projet précis, le volume de données n’est pas toujours un point clé).
L’un des objectifs du traitement des données est évidemment le ROI : gagner du temps, gagner de l’argent, avoir une vision prédictive… Il faut toutefois selon nos experts bien peser l’aspect éthique et bien sûr économique puisqu’il y a un coût à cette exploitation des données. Mais il peut être relativement limité. Des outils tels les data lakes mais aussi le langage Python ou R et bien sûr les outils des gros acteurs de la donnée, comme Google avec GCP ou Amazon et AWS, ont été cités pour le stockage ou la visualisation.
Nos experts ont aussi rappelé que derrière ces chiffres et outils, il y a des humains, avec des compétences, des biais… Avoir des spécialistes en interne est ainsi tout aussi intéressant que faire appel à des spécialistes externes qui auront un autre regard et qui faciliteront la prise de décision.
Enfin, avant de répondre aux questions de nos internautes et spectateurs, nous avons abordé les risques et limites de l’exploitation de la data. Nous vous laissons découvrir les éclairages de nos trois invités sur le sujet mais aussi les questions et réponses du Live dans le replay ci-dessus 😉
Pour continuer sur la thématique de la data
➡️ Découvrez les formations proposées par ENI École Informatique autour du DevOps
➡️ Retrouvez également les derniers contenus des Editions ENI consacrés à la data
➡️ Formez-vous à la data en quelques jours, en présentiel ou à distance, avec ENI Service – Centre de formation informatique.
Nos experts
Ingénieur et docteur en informatique, passionné de mathématiques et du langage Lisp, Guillaume SAUPIN a travaillé une dizaine d’années comme chercheur au Commissariat à l’Energie Atomique avant de rejoindre le monde de l’Intelligence artificielle et des start up. Il a enseigné le Computer Graphics en master à l’Université Paris 12 et à Epitech. Actuellement CTO chez Verteego, il est également auteur de plus d’une vingtaine d’articles pour le Linux Magazine France et publie régulièrement en anglais sur des sujets de Data Science dans la publication en ligne Toward Data Science.
Après un cursus d’ingénieur agronome et cinq années dans la recherche publique en écologie, Marie VAUGOYEAU, docteure en écologie et biologie évolutive, s’est ouverte au monde de la data d’entreprise, en tant que data scientist. Elle accompagne en tant que mentore free-lance les personnes désireuses de se former à l’analyse de leurs données. Rédactrice d’un blog de statistiques et R, et utilisatrice du langage R depuis plus de 10 ans, elle a écrit ce livre qui est un condensé de ce qu’elle transmet au quotidien dans son travail.
Responsable Relation Ecole-Entreprise à ENI Ecole informatique, conférencier, podcaster et ancien champion de Bobsleigh