Objectifs de la formation
- Identifier les possibilités d’utilisation des données, en fonction des besoins métier, en étant force de proposition dans l'exploration, l'évaluation de la qualité et l’interprétation de ces données
- Définir une stratégie de prise de décision par les données suivant les besoins métier
- Modéliser des bases de données relationnelles
- Réaliser des requêtes avancées répondant à des besoins métier complexes
- Automatiser des collectes de données
- Mettre en place une interface standard de partage automatique de données entre différentes applications et langages
- Contrôler les modalités de collecte et d’utilisation de données et mesurer les enjeux du RGPD
- Effectuer des choix méthodologiques pour l'automatisation des traitements et les documenter avec clarté et concision
- Utiliser les outils et méthodes modernes : méthodes agiles afin de permettre le travail en équipe, outils de suivi de projets, logiciel adapté à la rédaction de code
- Manipuler des structures de données et utiliser l’algorithmie afin de traduire en script des besoins de traitements de données
- Appliquer les bonnes pratiques de la programmation afin d'avoir un code organisé, réutilisable et partageable
- Utiliser les tableaux de données afin de faciliter l’import, la manipulation et la fusion de données
- Nettoyer les données, retraiter les valeurs aberrantes (outliers) et les valeurs manquantes
- Utiliser les expressions régulières (RegEx) pour traiter les valeurs textuelles et permettre une anonymisation des données personnelles dans le cadre du RGPD
- Utiliser les statistiques descriptives afin de modéliser les données
- Maîtriser le process d’apprentissage automatique (Machine Learning)
- Modéliser des régressions afin de définir des modèles de prévisions, et de trouver des tendances futures
- Modéliser des classifications et interpréter les métriques associées afin de catégoriser automatiquement des informations
- Traiter automatiquement le langage naturel (NLP) à partir de texte brut
- Contrôler et documenter les biais d'un modèle et des données d'entrainement afin d’estimer les risques éthiques
- Identifier et prioriser les informations à rendre accessibles et à présenter visuellement
- Utiliser les visualisations descriptives afin de représenter graphiquement des données statistiques et des informations modélisées
- Manipuler la Dataviz interactive et dynamique
- Réaliser de la cartographie
- Utiliser un Tableur afin de proposer des croisements de variables pour obtenir des informations recherchées
- Réaliser des tableaux de bord avec des outils de Business Intelligence afin d’intégrer et de croiser des informations utiles à des approches stratégiques de problématiques
- Prendre en compte les handicaps visuels afin de produire des graphiques...