Pandas & NumPy
Manipulation de données avec Python
Formation intensive dédiée aux deux bibliothèques fondamentales de la Data Science : NumPy pour les calculs numériques performants et Pandas pour la manipulation et le nettoyage de données tabulaires.
Objectifs de la formation
Programme détaillé
Jour 1 – NumPy : calcul scientifique
- Création et manipulation de ndarrays
- Indexation avancée et broadcasting
- Opérations mathématiques vectorisées
Jour 2 – Pandas : fondamentaux
- Series et DataFrames
- Lecture / écriture (CSV, Excel, JSON)
- Sélection, filtrage et tri
Jour 3 – Nettoyage & transformation
- Valeurs manquantes et doublons
- Renommage, remplacement, apply / map
- Création de nouvelles colonnes
Jour 4 – Agrégations & statistiques
- groupby() avancé
- Pivot tables et crosstab
- Statistiques descriptives
Jour 5 – Jointures & préparation ML
- merge(), concat(), join()
- Encodage des variables
- Normalisation et feature engineering
Modalités pratiques
Ce module est souvent intégré à nos parcours Data Science et
Intelligence Artificielle.
Intéressé(e) ? Échangeons ensemble.
Nous contacter