Le blog de la Wild Code School - Wild Code School

le B.A-BA de la Data : Démystifier l'univers des Données

Rédigé par Aurore Chatras | 16/08/2023

Les données numériques sont partout, dans notre quotidien, en entreprise et sous de multiples formes. Nous en produisons sans cesse ! Véritable mine d’or, elles n’ont pourtant de valeur que dans leur usage. Petite immersion dans les coulisses de la Data !

RETOUR SUR Les Fondamentaux

La première étape pour comprendre la data est de saisir ce que sont les données. En termes simples, les données sont des informations. Elles peuvent être des chiffres, des mots, des images ou même des vidéos. Imaginez-les comme des éléments de puzzle qui, lorsqu'ils sont assemblés, racontent une histoire. Mais avant de les utiliser, encore faut-il pouvoir les collecter.

 

La Collecte de Données

Les données sont recueillies à partir de diverses sources telles que les formulaires en ligne, les capteurs, les appareils électroniques, les réseaux sociaux, et plus encore. Par exemple, lorsque vous partagez une photo sur Instagram, c'est une donnée.

 

Les types de Données : Les données se divisent en deux catégories principales : les données structurées et les données non structurées. Les premières sont organisées dans des tableaux (comme les feuilles Excel), tandis que les dernières sont plus flexibles (comme les posts Twitter).

 

Le Traitement des Données

Maintenant que nous avons des données en main, que pouvons-nous en faire ?

  1. Nettoyage et Prétraitement : Avant d'analyser les données, il est essentiel de les nettoyer. Cela implique de supprimer les valeurs aberrantes, de remplir les cases vides et de normaliser les données pour qu'elles soient comparables.

  2. Analyse de Données : Cette étape consiste à explorer les données pour en extraire des informations utiles. On utilise des techniques statistiques et visuelles pour repérer des tendances, des modèles, ou des anomalies.

 

L'Analyse et l'Application

Maintenant que nous avons des données propres et des informations précieuses, que faisons-nous avec tout cela ?

  1. Analyse Prédictive : À l'aide d'algorithmes complexes, nous pouvons prévoir des événements futurs basés sur les modèles trouvés dans les données passées. Par exemple, prédire les ventes d'un produit en fonction des saisons précédentes ou des avis clients.

  2. Prise de Décision Informatisée : Les entreprises utilisent souvent des analyses de données pour prendre des décisions éclairées. Cela peut inclure la définition de stratégies marketing, l'optimisation des opérations logistiques, et bien plus encore.

 

Les métiers de la DATA

Dire que vous voulez travailler dans la data c’est comme dire que vous voulez être professeur. Cela reste très vague.

On mentionne, le plus souvent, les 3 métiers suivants :

 

Data Analyst 📊

📍 Le/la Data Analyst traite et analyse les données d'une entreprise pour en extraire des informations utiles à la stratégie de l’entreprise. Il/elle source, nettoie, apporte de la valeur aux données et les présente sous forme graphique pour les rendre compréhensibles : la Datavisualisation. Il a une vision data des problématiques de l’entreprise et aide à décider selon un angle data-driven. C’est la porte d’entrée vers les autres métiers de la data.

 

Data Scientist 🧮

📍 Le/la Data Scientist utilise des algorithmes de machine learning sur des données variées. Le but peut être de prédire l’évolution de la donnée, grouper les données (clustering) pour analyser leurs points communs et différences, et bien d’autres choses. Le Data Scientist lui va notamment se servir de compétences en intelligence artificielle

 

Data Engineer 🖥️

📍 Le/la Data Engineer crée, gère, optimise et sécurise les flux de données de l’entreprise. Grosso modo, il met en place l’architecture de systèmes de traitement de bases de données. Sans lui le Data Analyst et le Data Scientist n’ont pas accès à leur or noir : la donnée.

 

Au bon professionnel, les bons outils

 

Python LV1

Un data analyst code dans un ou plusieurs langages de programmation. Le plus utilisé est sans conteste Python. Avec Python on peut créer des sites web, des logiciels ou des jeux vidéos. Mais on peut également faire de l’analyse de données, du machine learning, du web scraping (récupération de données sur le web). Autant de choses dont peut avoir besoin un professionnel de la data. Il faut, par la suite, se familiariser avec des bibliothèques spécialisées dans l’analyse de données comme : Numpy ou Pandas.

Qui dit “données” dit aussi “base de données”. C’est l’endroit où sont stockées vos données. Un Data Analyst doit savoir interagir avec les bases de données dans leur langage qui est le SQL (Structured Query Languaged). Il doit notamment pratiquer le CRUD (Create, Read, Update, Delete). Une fois que vous l’aurez fait, vous comprendrez pourquoi certains geek disent : “ CRUD c’est la vie ! ”

Bien sûr, une image vaut mille mots. Et c'est justement la datavisualisation qui permet de rendre tout cela plus tangible. Il s'agit simplement d'utiliser des outils pour visualiser les données de manière esthétique et pertinente, avec un objectif pédagogique : Excel bien sûr, mais aussi  Tableau Software ou Power BI.

 

Basic Calculus

Un data analyst doit décrire les données pour pouvoir les analyser. C’est là que les mathématiques entrent en jeu, car les statistiques descriptives et inférentielles (probabilités) permettent justement d’atteindre cet objectif de manière rigoureuse et scientifique. Ils vont muscler votre raisonnement pour vous éviter de tomber dans pas mal de biais cognitifs (erreurs de jugement) qui vous auraient fait confondre corrélation et causalité. Il s’agit de 2 domaines précis des mathématiques, accessibles à tout le monde ! Et oui, pas besoin de doctorat en mathématiques pour se lancer dans la Data !

 

 

En conclusion, la data n'est pas aussi intimidante qu'elle en a l'air. C'est simplement le processus de collecte, de nettoyage, d'analyse et d'application d'informations pour obtenir des connaissances exploitables. Alors que le monde devient de plus en plus axé sur les données, comprendre ces concepts de base peut ouvrir des portes vers des opportunités passionnantes dans le domaine de la technologie. 

Si vous êtes désormais prêt à explorer cet univers foisonnant et souhaitez en acquérir les bases : découvrez notre formation Data Analyst en bootcamp, ainsi que nos alternances Data Scientist et Data Engineer.