Page précédente

Concepteur développeur en intelligence artificielle et analyse big data

Niveau Niveau III (BTS, BUT, DEUST)
Type : Autre titre inscrit sur demande au RNCP (niveau 6)
Certificateur(s) : VB Management
Picto partage
  • Partager par mail
  • Imprimer
Par la formation initale : Oui
Par la formation continue : Oui
Par l'apprentissage' : Oui
Par unité de capitalisation : Oui
Sur demande individuelle : Non
En contrat de pro : Non
Par la VAE : Non

Descriptif

Picto dérouler/rouler

Le marché de la donnée et de l'IA connaît une croissance exponentielle grâce à l'impact croissant de la numérisation, des objets connectés, des réseaux sociaux et des plateformes numériques. Selon des études, le marché de l'IA devrait atteindre 90 milliards de dollars en 2025. Le gouvernement français a mis en place une stratégie nationale pour l'IA, soutenue par des investissements importants.

Les métiers de la donnée sont répartis en plusieurs pôles, tels que la collecte, le traitement, l'analyse, la protection des données, le développement de modèles d'apprentissage et les opérations liées aux bases de données.

La certification de Concepteur développeur en IA et analyse Big Data répond aux compétences requises pour les data scientists et les data analysts mais aussi pour d'autres métiers liés au traitement de la donnée et de l'intelligence artificielle.

Ces professionnels sont très recherchés sur le marché du travail. Que ce soit pour rendre les données intelligentes et résoudre des problématiques métier ou exploiter les données pour faciliter la prise de décisions, la maîtrise de l'apprentissage automatique, de la science de la donnée et de la visualisation est devenue essentielle dans de nombreux secteurs.

Activités visées :

  • Mettre en place des processus de collecte de données de façon automatisée en utilisant des outils d’orchestration ou des scripts informatiques et en respectant les normes légales (RGPD).
  • Réaliser des opérations de transformation de données pour écarter les valeurs mal formatées, erronées ou simplement incohérentes et ainsi assurer la qualité des futures analyses.
  • Combiner les données pour en créer des modèles : identifier toutes les dimensions et variables qui seront nécessaires à l’analyse de la performance de chaque équipe métier et les mettre à leur disposition.
  • Réaliser une étude statistique descriptive des données (distribution, moyenne, écart-type…) pour mieux comprendre comment elles sont distribuées et ainsi expliquer les grandes tendances.
  • Utiliser des techniques d’apprentissage automatique : concevoir des programmes informatiques pour expliquer la relation entre une et plusieurs variables afin de prédire des tendances ou de regrouper les données par caractéristiques communes.
  • Organiser un travail de cadrage de projet data : réaliser une veille technologique des outils et des techniques statistiques, planifier les différentes étapes du projet tout en évaluant les risques associés.
  • Organiser et coordonner le travail nécessaire à la mise en place d’un projet data : identifier les personnes utiles à sa bonne réalisation, mettre en place des outils de gestion de projet et présenter les résultats du projet en s’adaptant au public visé.
  • Utiliser des techniques d’apprentissage profond (deep learning) pour exploiter des données non structurées (données textuelles ou visuelles) et approfondir ses analyses ou améliorer la qualité de ses prédictions.
  • Mettre en production les algorithmes d’apprentissage profond, en monitorer dans le temps les performances et les améliorer en fonction des différentes innovations technologiques.
  • Identifier les indicateurs clés de performance de chaque équipe métier en conduisant des entretiens pour comprendre précisément leurs besoins.
  • Mettre à disposition des équipes métiers des interfaces graphiques représentant les indicateurs clés de performance métier (tableaux de bord) afin de les aider dans leurs prises de décision, et ce en s’adaptant au public visé.

Objectifs

Picto dérouler/rouler

  • Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
  • Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
  • Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
  • Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
  • Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
  • Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
  • Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
  • Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
  • Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
  • Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
  • Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
  • Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
  • Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
  • Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
  • Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
  • Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
  • Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
  • Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
  • Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
  • Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
  • Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.

Programme

Picto dérouler/rouler

Non communiqué

Module

Picto dérouler/rouler

Non communiqué

Poursuite d'études

Picto dérouler/rouler

Non communiqué