L’arrivée du Big Data et la multiplicité des sources de données font que les besoins en matière d’analyse de données deviennent de plus en plus importants. Les statistiques sont le moyen le plus performant pour décrire et interpréter les données et ainsi mettre en lumière de nouvelles connaissances.

L’objectif de cette vidéo est de vous montrer comment utiliser le langage Python dans le cadre de la Data Science pour être en mesure d’analyser de gros volumes de données.

Après une présentation de Numpy et Pandas, deux bibliothèques dédiées à la Data Science, nous travaillerons sur la préparation et la visualisation de données. Nous verrons ensuite l’application des statistiques pour analyser des variables et réaliser des estimations de modèles avec la bibliothèque Scikit-Learn.

Auteur(s)

Madjid KHICHANE
Après un diplôme d'ingénieur en Informatique obtenu à l'université Mouloud Mammeri à Tizi-Ouzou en Algérie puis un Master en Intelligence Artificielle - Systèmes multi-agents obtenu à l'université Paris 5 (René Descartes), Madjid KHICHANE a soutenu son PhD en Intelligence Artificielle en collaboration entre l'Université Claude Bernard Lyon 1 et IBM. Cette thèse doctorale a donné naissance à des innovations algorithmiques dans le domaine de l'apprentissage par renforcement qui sont aujourd’hui publiées dans des conférences internationales de premier niveau. Madjid KHICHANE est également l’auteur d’autres parutions aux Editions ENI telles que les ouvrages Microsoft Bot Framework - Maîtrisez le développement de chatbots avec les services cognitifs d'Azure et Data Science avec Microsoft Azure - Maîtrisez le Machine Learning sur Cortana Intelligence Suite ou la vidéo Azure Machine Learning Studio - Développez vos modèles de Machine Learning dans Azure.
Réf. ENI :