Python pour Machine Learning
Maitrisez Python et développez des algorithmes de Machine Learning
Python est un des langages qui s’est imposé pour la Data Science. Outre, sa syntaxe aisée à apprendre, il fait l’objet de nombreuses contributions de la communauté qui offrent des librairies permettant de facilement traiter, visualiser et modéliser les données.
Au cours de la formation, les participants auront l’occasion d’implémenter les algorithmes suivants : analyse discriminante, régression logistique et arbres de décisions.
Différents cas illustratifs seront proposés tout au long de la formation afin que les participants puissent appliquer les acquis sur des bases de données réelles et en tirer des conclusions d’analyse pertinentes. Ils utiliseront également le langage Python pour la préparation des données et la validation des modèles.
Durée de la formation
Début de la formation
Objectifs de la formation
Les compétences visées par la formation sont les suivantes :
- Maitriser la syntaxe de Python
- Utiliser les outils de Python permettant le traitement, la visualisation et la modélisation des données
- Utiliser et développer des algorithmes de Machine Learning
Public de la formation
Cette formation s’adresse au profil métier Data Scientist
Points forts de la formation
Les participants sont amenés à échanger leurs expériences personnelles sur les différents concepts abordés durant de la formation. Les différentes problématiques rencontrées feront l’objet d’une discussion afin d’y apporter des solutions transférables à différentes organisations.
Prérequis pour la formation
Bonnes bases de statistiques et de data mining ou avoir suivi la formation Statistiques et Probabilités et introduction au data mining
Programme
de la formation
- Les bases de Python
- Organisation d’un programme
- Types de données simples et complexes, List
- Compréhension
- Structures de contrôle
- Gestion des fichiers
- Principaux modules et fonctions
- Préparation des données avec pandas
- Lecture et écriture des données depuis et vers différentes sources (fichiers textes, Excel, bases de données, etc.)
- Filtrage, sélection, transformation, calcul, agrégation, jointure, sorties simples
- La visualisation de données avec matplotlib & seaborn
- Revue des différents types de graphiques
- Apprentissage et analyse statistique avec scikit learn & statsmodels
- Revue des techniques
- L’analyse discriminante
- La régression logistique
- Les arbres de décision
- Gestion des ensembles d’apprentissage et de test
- Évaluation des modèles
- Introduction à l’utilisation de Spark avec Python (pyspark)
Prix de la formation
Formation agréée Chèques-Formation
En savoir plus sur nos tarifs