Matplotlib est une bibliothèque Python open-source créée en 2002 par John Hunter. Son objectif initial était de reproduire les fonctionnalités graphiques de MATLAB en Python. Aujourd'hui, elle est devenue la référence pour la création de graphiques statiques, animés et interactifs dans l'écosystème Python.
Matplotlib est la bibliothèque de référence pour créer des visualisations statiques en Python. Elle permet de représenter des données sous forme de graphiques simples (courbes, histogrammes, diagrammes en barres) ou complexes (graphiques 3D, scatter plots). Parmi ses points forts :
Pour les Business Analysts, c'est un outil essentiels pour présenter des informations complexes aux différentes parties prenantes, qu’il s’agisse d’équipes techniques, de cadres ou de clients. Matplotlib vous aide à :
Pour commencer à utiliser Matplotlib avec Python, vous devez l’installer et l’importer dans votre environnement de développement. Voici les étapes pour l'installer et l'importer.
1. Installation : Si vous ne l'avez pas déjà installée, utilisez la commande suivante dans votre terminal ou invite de commande :2. Importation : Une fois installée, vous pouvez l'importer dans votre fichier Python. L'interface pyplot de Matplotlib est couramment utilisée car elle simplifie grandement la création de graphiques. Voici comment l'importer sous l’alias plt
:
L'alias plt
est fréquemment utilisé dans la communauté Python pour simplifier la syntaxe et rendre le code plus lisible.
Le graphique le plus élémentaire que vous pouvez créer avec Matplotlib est un nuage de point (scatter plot). Voici comment afficher un graphique simple avec des données fictives :
Le code ci-dessus trace les points (x, y)
sur une courbe et affiche le résultat. plt.show()
est utilisé pour afficher le graphique dans une fenêtre graphique.
Matplotlib vous permet de personnaliser facilement les couleurs de vos graphiques. Vous pouvez changer la couleur de la courbe en utilisant l’argument color
:
Il existe de nombreuses options pour définir la couleur dans Matplotlib, que ce soit par nom ('red'
), code hexadécimal ('#FF5733'
), ou encore des niveaux de gris ('0.5'
).
Pour rendre vos graphiques plus compréhensibles, il est important d'ajouter un titre et de labelliser vos axes :
Avec cette approche, vous pouvez rapidement donner un contexte à vos graphiques en indiquant ce que représentent les données.
Pour comparer des catégories, rien de tel que le diagramme en barres. Il permet de visualiser les différences entre plusieurs groupes de données. Voici un exemple :
Pour représenter la distribution d'une variable, l'histogramme est l'outil idéal. Il vous permet de comprendre comment les valeurs se répartissent dans un ensemble de données, comme la répartition des revenus des clients ou la répartition des notes d'une enquête :
L’histogramme est une excellente façon de visualiser la répartition des données et de détecter des anomalies ou des tendances.
Que vous souhaitiez représenter des données simples ou complexes, Matplotlib est un outil puissant pour visualiser vos données en Python. Grâce à sa flexibilité, vous pouvez personnaliser vos graphiques en fonction de vos besoins spécifiques, qu’il s’agisse de changer les couleurs, les styles ou d’ajouter des titres et des légendes.
Pour aller plus loin avec Python et approfondir vos compétences en visualisation de données, découvrez notre Skill Course Python pour les Business Analysts !