Formation Data Science
Analyse • Visualisation • Machine Learning
Cette formation intensive vous permet de comprendre, manipuler et valoriser les données avec Python : de l’analyse exploratoire aux premiers modèles de Machine Learning appliqués.
Objectifs de la formation
Manipuler et analyser des données avec Pandas et NumPy.
Nettoyer des datasets réels : valeurs manquantes, doublons, outliers.
Réaliser des analyses exploratoires (EDA) et visualisations.
Construire et évaluer des modèles de Machine Learning.
Programme détaillé
1
Jour 1 – Introduction à la Data Science
- Panorama des métiers de la Data
- Cycle de vie d’un projet Data
- Méthodologies (CRISP-DM)
2
Jour 2 – Python pour la Data
- Rappels Python essentiels
- NumPy : tableaux, calculs vectoriels
- Pandas : DataFrame, indexation, filtres
3
Jour 3 – Nettoyage & préparation
- Valeurs manquantes et doublons
- Encodage des variables
- Normalisation et outliers
4
Jour 4 – Visualisation & EDA
- Matplotlib et Seaborn
- Analyse des distributions
- Storytelling avec les données
5
Jour 5 – Machine Learning
- Train / test split et évaluation
- Régression et classification
- Projet Machine Learning complet
Modalités pratiques
Durée : 5 à 10 jours intensifs
Format : 100 % à distance ou présentiel
Évaluation : projet final + restitution
Attestation : remise en fin de formation