Comme tu dois déjà le savoir, depuis l'avènement d’internet, les données générées sont de plus en plus nombreuses. 💡On estime que chaque jour c’est 2,5 trillions (= 1 million de million) de données qui sont générées dans le monde...
Il existe de nombreux types de données différentes qui proviennent de sources diverses :
- Les réseaux sociaux et le web (messages, like, tweet, vidéos, photos… )
- Les emails et SMS
- Le cloud, les logiciels en ligne et les outils CRM (=customer relationship management)
- Les objets connectés (Alexa, électroménagers, voitures, systèmes de surveillance, etc…)
- Les données internes aux entreprises, aux associations et aux structures publiques.
La question que les entreprises ont commencé à se poser est la suivante :
Que faire avec autant de données et comment les exploiter pour les valoriser ?
C’est là, à ce moment précis, que de nouveaux métiers sont apparus et que de nouvelles compétences sont nées. On a commencé à entendre parler de postes de data miner, chief data officer, data analyst, data engineer, business Intelligence Manager, data architecte et j’en passe…
Mais comment s’y retrouver avec tous ces métiers ? Sont-ils tous équivalents ? 🤯
Ok, reprenons depuis le début !
Pour commencer, il faut savoir qu’en France, certains métiers sont plus représentés et plus demandés dans le monde de la Big Data. Cela concerne :
- les Data Analysts
- les Data Scientists
- les Data Engineers
🧐 Concentrons nous donc sur ces 3 métiers.
Ils sont centrés sur la gestion des données et représentent la majorité des postes à pourvoir en entreprises aujourd’hui en France.
Data Analyst 📊
📍 Le/la data analyst, ou analyste de la donnée en français, traite et analyse les données d'une entreprise pour en extraire des informations utiles à la stratégie de l’entreprise.
Il/elle source, nettoie, apporte de la valeur aux données et les présente sous forme graphique pour les rendre compréhensibles.
Pour cela il/elle doit avoir de bonnes notions en mathématiques et statistiques. Il/elle utilise des langages de programmation comme Python ou R, pour récupérer les données; SQL un langage qui permet de communiquer avec les bases de données ou encore des logiciels de data visualisation comme Tableau Software ou Power BI pour créer des graphiques.
Data Scientist 🧮
📍 Si l’on suit les définitions initiales de ce qu’est un.e data scientist, il/elle est le niveau supérieur d’un.e data analyst.
Son rôle reste le même : améliorer la stratégie de l’entreprise, mais pour ça il/elle va utiliser les mathématiques et les statistiques à un niveau encore plus élevé.
Quelle différence avec le data analyst ?
Il/elle travaille sur des quantités de données encore plus larges et non structurées, va détecter des tendances et convertir les données pour les rendre exploitables et viables. Il/elle maîtrise les mêmes outils de programmation ou de visualisation que le/la data analyst, à un niveau plus élevé. Le data scientist lui va notamment se servir de compétences en intelligence artificielle.
⚠️ Attention : Dans la presse généraliste et sur internet, les articles qui parlent de “data scientist” fusionnent souvent avec le métier de data analyst et ne différencient pas les deux métiers.
Data Engineer 🖥️
📍 On peut considérer que le/la data engineer est un niveau au dessus et possède encore plus de compétences en mathématiques, statistiques et particulièrement en informatique.
Il/elle conceptualise, développe, met en place l’architecture de systèmes de traitement de bases de données.
Les langages de programmation Java ou Python sont particulièrement appréciés et utilisés par les data engineer. Il/elle maîtrisent aussi des ensembles de composants logiciels, comme par exemple Hadoop qui permet le traitement de grandes quantités de données ou des logiciels de gestion de base de données comme MongoDB.
Pour résumer :
Ce que tu dois premièrement retenir de tout cela, c’est que les statistiques et les mathématiques constituent la base des métiers de la data. On ajoute à cela les langages de programmation tels que Python, R ou Java et des compétences poussées en informatique pour le/la data engineer.
Deuxièmement, et lorsque tu parcours les offres de poste, les rôles des data analyst et scientist peuvent être plus flous qu’ils n’y paraît dans les entreprises.
Tout va finalement dépendre de la taille des entreprises, du nombre de données et de l’objectif que l’entreprise s’est fixé en terme de traitement de données.
Le plus important au delà du titre du poste reste finalement les compétences qui vont être demandées pour le poste.
Et pour terminer, d’autres métiers commencent à prendre de plus en plus d’ampleur comme par exemple “déléguée à la protection des données” qui sera selon Linkedin le métier le plus recherché en 2020.
🔥 Tu veux aller plus loin ?
- Une liste encore plus complète des métiers de la data
- Emission de France Culture sur la Big Data
- Infographie : les chiffres clés de la Big Data
Tu veux te former aux métiers de la data ?
Rejoins notre formation de data analyst au mois de mars ! Plus d’informations par ici