LA DATA ANALYSE EN TROIS POINTS CLES
La Data Analyse consiste en :
- La compréhension des données,
- La présentation des données,
- La préparation des données.
Pas de bonne prédiction, sans données de qualité.
Le rôle de la Data Analyse consiste donc à comprendre votre problématique métier et de sélectionner les données qui pourront y répondre.
Cette sélection de données s’effectue dans les environnements préparés lors de la phase de Data Engineering.
LA COMPREHENSION DES DONNEES
La première étape de la Data Analyse concerne la compréhension des données.
Réalisée par le Data Analyst, celle-ci consiste à comprendre le lien entre les données et votre problématique.
Disposez-vous d’assez de données ? Sont-elles de bonnes qualités ? Sont-elles en rapport avec l’objectif à atteindre ?
Ce sont ces questions qui devront trouver réponse.
L’EXPLORATION DETAILLEE DES DONNEES (EDA)
Cette phase fait appel aux connaissances statistiques et mathématiques du Data Analyst.
L’objectif de cette étape est de comprendre l’ensemble des données et leurs interactions avec la problématique à résoudre.
C’est ici que seront identifiées et traitées les valeurs manquantes et les valeurs aberrantes. Nous parlerons également de corrélation, de réduction de dimension, de série temporelles…
PRESENTATION DES DONNEES
Un graphique est plus parlant qu’un grand tableau de chiffres.
Le rôle de la Data Analyse va être de proposer des éléments de visualisations des données afin que celles-ci soient comprises par l’ensemble des parties prenantes du projet.
Histogrammes, boîtes à moustaches, visualisation spatiale sont autant d’outils graphiques mis en œuvre.
DES CONSULTANTS AUX COMPETENCES EN MATHEMATIQUES ET INFORMATIQUES
Nos consultants Data Analysts ont à la fois des compétences en mathématiques et statistiques, mais aussi en langage de programmation.
Il est en effet nécessaire de connaître le langage de programmation Python afin d’interroger les environnements préparés lors de la phase de Data Engineering.
Cette maîtrise du langage de programmation est également nécessaire pour préparer les données et proposer des interfaces de visualisation graphique à forte valeur ajoutée.
Sans oublier des connaissances dans l’usage des outils d’analyse du marché tel que Power Bi ou bien Tableau Software.
Leur champ de compétences ne se limite pas à l’analyse des données, mais inclut également des connaissances dans le domaine du Machine Learning. Cette double compétence permet de préparer au mieux les données pour la phase de Data Science.