Data15 jours
Parcours Data Analyst
Professionnels souhaitant se reconvertir en data analyst
105h de formationdistancielpresentiel

Objectifs pedagogiques
- Maitriser SQL pour l'extraction et la manipulation de donnees
- Utiliser Python pour l'analyse de donnees (Pandas, NumPy)
- Creer des visualisations impactantes (Matplotlib, Seaborn, Plotly)
- Construire des dashboards interactifs (Tableau, Power BI)
- Appliquer des techniques de machine learning pour l'analyse predictive
- Mener un projet d'analyse de donnees de A a Z
- Obtenir une certification reconnue Data Analyst
Programme
- •Role et missions du data analyst
- •Cycle de vie d'un projet data
- •Types de donnees : structurees, semi-structurees, non-structurees
- •Sources de donnees : BDD, API, fichiers CSV/JSON, web scraping
- •Ethique et RGPD dans l'analyse de donnees
- •Outils du data analyst : panorama SQL, Python, BI tools
- •Atelier : analyse exploratoire d'un dataset reel
- •Bases de donnees relationnelles : tables, cles primaires/etrangeres
- •SELECT, WHERE, ORDER BY, LIMIT
- •Filtres et operateurs : AND, OR, IN, BETWEEN, LIKE
- •Fonctions d'agregation : COUNT, SUM, AVG, MIN, MAX
- •GROUP BY et HAVING
- •Atelier : requetes d'analyse sur une BDD e-commerce
- •INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN
- •CROSS JOIN et self-joins
- •Sous-requetes : WHERE, FROM, SELECT
- •CTEs (Common Table Expressions) avec WITH
- •UNION et UNION ALL
- •Atelier : analyse multi-tables (clients, commandes, produits)
- •Fonctions de fenetre : ROW_NUMBER, RANK, DENSE_RANK
- •LAG, LEAD, FIRST_VALUE, LAST_VALUE
- •PARTITION BY et ORDER BY dans les window functions
- •Date et temps : extraction, formatage, calculs
- •CASE WHEN pour la logique conditionnelle
- •Atelier : analyse de cohortes et retention clients
- •Installation Anaconda et Jupyter Notebook
- •Syntaxe Python : variables, types, structures de controle
- •Listes, tuples, dictionnaires, sets
- •Introduction a Pandas : Series et DataFrame
- •Lecture de fichiers : CSV, Excel, JSON
- •Atelier : chargement et premiere exploration d'un dataset
- •Selection : loc, iloc, filtres booleens
- •Tri et indexation
- •Gestion des valeurs manquantes : dropna, fillna
- •Ajout et suppression de colonnes
- •Apply, map, applymap
- •Atelier : nettoyage et preparation d'un dataset brut
- •groupby et agregations multiples
- •Pivot tables et crosstabs
- •Merge et join de DataFrames
- •Concat et append
- •Time series et resampling
- •Atelier : analyse de ventes par region et periode
- •Principes de data visualization
- •Matplotlib : line plots, bar charts, histogrammes, scatter plots
- •Seaborn : amelioration esthetique et plots statistiques
- •Heatmaps, pairplots, boxplots, violinplots
- •Personnalisation : titres, labels, legendes, couleurs
- •Atelier : creation d'un rapport visuel complet
- •Plotly Express : syntaxe simple et rapide
- •Graphiques interactifs : zoom, hover, filtres
- •Cartes geographiques et choropleth
- •Dashboards Plotly Dash
- •Export HTML et integration web
- •Atelier : dashboard interactif de KPIs business
- •Introduction a Tableau Desktop
- •Connexion aux sources de donnees
- •Drag-and-drop : dimensions et mesures
- •Visualisations : graphiques, tableaux, cartes
- •Filtres, parametres, calculs
- •Dashboards et storytelling
- •Atelier : creation d'un dashboard executif complet
- •Statistiques descriptives : moyenne, mediane, mode, ecart-type
- •Distribution et visualisation : histogrammes, boxplots
- •Correlation et causalite
- •Tests d'hypothese : t-test, chi-square
- •P-value et intervalle de confiance
- •Atelier : analyse statistique d'une campagne marketing A/B
- •Apprentissage supervise vs non supervise
- •Regression lineaire : principe et implementation
- •Evaluation de modele : MSE, RMSE, R-squared
- •Train/test split et validation croisee
- •Scikit-learn : fit, predict, score
- •Atelier : prediction de prix immobilier avec regression lineaire
- •Regression logistique
- •Arbres de decision et Random Forest
- •K-Nearest Neighbors (KNN)
- •Metriques de classification : accuracy, precision, recall, F1-score
- •Matrice de confusion et courbe ROC
- •Atelier : prediction de churn clients
- •K-Means clustering
- •DBSCAN et clustering hierarchique
- •Evaluation de clustering : silhouette score, elbow method
- •PCA (Principal Component Analysis)
- •Use cases : segmentation clients, detection d'anomalies
- •Atelier : segmentation de clientele e-commerce
- •Choix d'un dataset et definition de la problematique
- •Extraction et preparation des donnees (SQL + Python)
- •Analyse exploratoire et statistique
- •Modelisation predictive
- •Visualisations et dashboard final
- •Presentation des resultats et recommandations
- •Examen de certification Data Analyst
- •Bilan de competences et roadmap carriere
Prerequis
- •Aisance avec l'outil informatique
- •Esprit analytique et logique
- •Bases en mathematiques (statistiques niveau lycee)
- •Aucun prerequis en programmation
Modalites d'evaluation
Exercices pratiques tout au long du parcours, analyses de cas reels, projet final d'analyse de donnees, examen de certification Data Analyst
Feuilles d'emargement, suivi de connexion pour le distanciel, evaluation des acquis en fin de formation, certification Data Analyst.
Accessibilite handicap
Formation accessible aux personnes en situation de handicap. Referent handicap disponible pour adapter les modalites.