Matplotlib est une bibliothèque Python open-source créée en 2002 par John Hunter. Son objectif initial était de reproduire les fonctionnalités graphiques de MATLAB en Python. Aujourd'hui, elle est devenue la référence pour la création de graphiques statiques, animés et interactifs dans l'écosystème Python.
Pourquoi utiliser Matplotlib ?
Matplotlib est la bibliothèque de référence pour créer des visualisations statiques en Python. Elle permet de représenter des données sous forme de graphiques simples (courbes, histogrammes, diagrammes en barres) ou complexes (graphiques 3D, scatter plots). Parmi ses points forts :
- Grande flexibilité : Matplotlib permet de personnaliser presque chaque élément d'un graphique, des couleurs aux styles de lignes.
- Compatibilité avec d'autres bibliothèques : Elle s'intègre parfaitement avec des bibliothèques comme Pandas, NumPy ou encore Seaborn.
- Communauté active : Matplotlib dispose d’une vaste communauté d'utilisateurs et de nombreuses ressources en ligne pour vous accompagner dans vos projets.
- Open-source et gratuite : Matplotlib est libre d’utilisation et continuellement améliorée par des contributions open-source.
Pour les Business Analysts, c'est un outil essentiels pour présenter des informations complexes aux différentes parties prenantes, qu’il s’agisse d’équipes techniques, de cadres ou de clients. Matplotlib vous aide à :
- Simplifier l’interprétation des données : Visualiser les tendances, les anomalies ou les corrélations devient plus facile grâce à des graphiques.
- Rendre les présentations plus percutantes : Les graphiques améliorent la compréhension et l’engagement lors des réunions ou des rapports.
- S'adapter à différents types de données : Que vous travailliez avec des données financières, des KPI ou des résultats d’enquêtes, Matplotlib vous permet de représenter ces données sous forme de courbes, d’histogrammes ou de diagrammes à barres.
Comment utiliser Matplotlib ?
Installation et importation
Pour commencer à utiliser Matplotlib avec Python, vous devez l’installer et l’importer dans votre environnement de développement. Voici les étapes pour l'installer et l'importer.
1. Installation : Si vous ne l'avez pas déjà installée, utilisez la commande suivante dans votre terminal ou invite de commande :pip install matplotlib
2. Importation : Une fois installée, vous pouvez l'importer dans votre fichier Python. L'interface pyplot de Matplotlib est couramment utilisée car elle simplifie grandement la création de graphiques. Voici comment l'importer sous l’alias plt
:
import matplotlib.pyplot as plt
L'alias plt
est fréquemment utilisé dans la communauté Python pour simplifier la syntaxe et rendre le code plus lisible.
Les bases de l'utilisation de Matplotlib
1. Créer un graphique simple
Le graphique le plus élémentaire que vous pouvez créer avec Matplotlib est un nuage de point (scatter plot). Voici comment afficher un graphique simple avec des données fictives :
import matplotlib.pyplot as plt
# Données d'exemple
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
# Création du graphique
plt.plot(x, y)
# Affichage du graphique
plt.show()
Le code ci-dessus trace les points (x, y)
sur une courbe et affiche le résultat. plt.show()
est utilisé pour afficher le graphique dans une fenêtre graphique.
2. Changer la couleur d'un graphique
Matplotlib vous permet de personnaliser facilement les couleurs de vos graphiques. Vous pouvez changer la couleur de la courbe en utilisant l’argument color
:
plt.plot(x, y, color='green') # La courbe sera verte
plt.show()
Il existe de nombreuses options pour définir la couleur dans Matplotlib, que ce soit par nom ('red'
), code hexadécimal ('#FF5733'
), ou encore des niveaux de gris ('0.5'
).
3. Ajouter des titres et des labels
Pour rendre vos graphiques plus compréhensibles, il est important d'ajouter un titre et de labelliser vos axes :
plt.plot(x, y, color='blue')
plt.title('Exemple de graphique')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
plt.show()
Avec cette approche, vous pouvez rapidement donner un contexte à vos graphiques en indiquant ce que représentent les données.
AUTRES Types de graphiques courants avec Matplotlib
Diagramme en barres
Pour comparer des catégories, rien de tel que le diagramme en barres. Il permet de visualiser les différences entre plusieurs groupes de données. Voici un exemple :
# Comparaison de plusieurs catégories
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 2, 8]
# Création du diagramme en barres
plt.bar(categories, values)
plt.show()
Histogramme
Pour représenter la distribution d'une variable, l'histogramme est l'outil idéal. Il vous permet de comprendre comment les valeurs se répartissent dans un ensemble de données, comme la répartition des revenus des clients ou la répartition des notes d'une enquête :
import numpy as np
import matplotlib.pyplot as plt
# Génération de données aléatoires
data = np.random.randn(1000)
# Création de l'histogramme
plt.hist(data, bins=30)
plt.show()
L’histogramme est une excellente façon de visualiser la répartition des données et de détecter des anomalies ou des tendances.
Que vous souhaitiez représenter des données simples ou complexes, Matplotlib est un outil puissant pour visualiser vos données en Python. Grâce à sa flexibilité, vous pouvez personnaliser vos graphiques en fonction de vos besoins spécifiques, qu’il s’agisse de changer les couleurs, les styles ou d’ajouter des titres et des légendes.
Pour aller plus loin avec Python et approfondir vos compétences en visualisation de données, découvrez notre Skill Course Python pour les Business Analysts !