La certification permet d'attester l'acquisition des compétences suivantes :
BLOC 1 - Prétraiter et analyser des données structurées pour répondre à un problème métier.
- Déterminer les objectifs d'une analyse de données à partir d'un problème métier.
- Effectuer des opérations de nettoyage sur des données structurées.
- Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.
- Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.
- Représenter des données grâce à des graphiques clairs et pertinents.
Formuler des préconisations pour un traitement automatisé des données.
BLOC 2 - Entraîner un modèle d'apprentissage automatique supervisé pour réaliser une analyse prédictive.
- Sélectionner et/ ou transformer les variables pertinentes pour la modélisation (feature engineering).
- Sélectionner et mettre en place un modèle d'apprentissage supervisé adapté à une problématique métier.
- Évaluer les performances d'un modèle d'apprentissage supervisé.
- Adapter les paramètres d'un modèle d'apprentissage supervisé afin de l'améliorer.
BLOC 3 - Entraîner un modèle d'apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.
- Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).
- Sélectionner et mettre en place un modèle d'apprentissage non supervisé adapté une problématique métier.
- Évaluer les performances d'un modèle d'apprentissage non supervisé.
- Adapter les paramètres d'un modèle d'apprentissage non supervisé afin de l'améliorer.
BLOC 4 - Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.
- Collecter des données répondant à des critères définis via une interface de programmation (API).
- Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.
- Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.
- Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul.
- Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire.
BLOC 5 - Présenter et déployer un modèle d'apprentissage automatique auprès de ses utilisateurs finaux.
- Déployer un modèle via une interface de programmation (API) dans le web.
- Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.
- Réaliser la présentation orale d'une démarche de modélisation à un client interne/ externe.
- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.
- Assurer l'intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.
BLOC 6 - Déployer un modèle d'apprentissage automatique à l'échelle en utilisant les technologies du Big data.
- Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data.
- Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.
- Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.