Le blog de la Wild Code School - Wild Code School

Tout comprendre à la computer vision

Rédigé par Thibault Caudron | 07/08/2023

Et si les ordinateurs pouvaient voir comme l’être humain, c’est-à-dire être capables d’interpréter une image et prendre la décision appropriée ? C’est toute l’ambition de la computer vision, ou vision par ordinateur en français. Ce qui n’était qu’une idée un peu folle dès le début des années 1960, a été rendue possible par le spectaculaire développement de la puissance de calcul et de la capacité de stockages des machines, mais aussi le développement des technologies d’Intelligence Artificielle. Ceux qui disposent de la reconnaissance faciale pour activer leur smartphone peuvent en témoigner...

 

La complexité du monde visuel

Voir et tout de suite comprendre une situation, une photo, une vidéo semble naturel pour un être humain tant son cerveau a ses capacités fantastiques. L’ordinateur, lui, doit faire face à la complexité du monde visuel : les conditions d’éclairage, le chevauchement des objets, des parties cachées, l’angle de vision, le mouvement, ou encore les différences entre plusieurs designs de chaises par exemple. La computer vision représente donc un véritable challenge scientifique pour permettre à la machine de percevoir le contenu dans n’importe quelle situation et d’en extraire les bonnes informations. C’est là où les êtres humains gardent encore une longueur d’avance pour donner du sens et comprendre le contexte de l’image, mais pour combien de temps encore ?

La puissance de l’Intelligence Artificielle 

Les performances de plus en plus accrues de la computer vision reposent sur deux technologies essentielles : le deep learning et le réseau de neurones convolutifs (CNN). La première est une des branches de l’Intelligence Artificielle. Pour savoir interpréter une image, l’ordinateur a besoin de beaucoup de données. Dans le cas d’une fleur par exemple, il va analyser des millions de photos, en comprendre les caractéristiques, notamment en termes de formes ou de couleurs, et enfin pouvoir distinguer une fleur d’une autre. L’apprentissage est dit automatique, car ce sont les algorithmes qui permettent à la machine d’apprendre par elle-même à partir des données qui lui sont fournies.

 

S’inspirer du cerveau humain 

Le réseau de neurones convolutifs, pour simplifier, fonctionne quant à lui, à la manière du cerveau humain. Il décompose l’image en pixels, puis différentes couches de neurones en extraient des caractéristiques spécifiques, comme par exemple les bordures, les formes, les couleurs, pour au final produire des probabilités que le sujet de l’image corresponde bien à ce qui est recherché.

Ces deux technologies bénéficient des impressionnantes avancées en matière de capacités de stockage et de puissance de calcul.

 

Des capacités exceptionnelles

Toutes ces technologies ont développé les capacités exceptionnelles de la computer vision. La détection notamment, c’est-à-dire le fait de repérer sur une image un objet ou un sujet en particulier. La classification, elle, est possible pour par exemple déterminer à quelle espèce appartient l’animal que l’ordinateur a remarqué sur l’image en question. Plus fort encore, l’identification permet de faire la différence entre deux personnes différentes.

Comme pour toute avancée technologique, des voix s’élèvent néanmoins pour encadrer les usages par des juridictions strictes. La reconnaissance faciale utilisée par les pouvoirs publics ou des entreprises privées pose notamment la question des libertés individuelles.

 

La computer vision en met plein la vue

Au-delà de la prouesse technologique, la computer vision intéresse de nombreux secteurs. Elle est essentielle au développement de la fameuse voiture autonome qui est au cœur de l’actualité, pour comprendre tout ce qui est sur sa route, panneaux, marquage au sol, obstacles, et prendre les bonnes décisions. La vie des passagers en dépend… Dans le secteur de la santé, la computer vision peut aider les professionnels médicaux à mieux diagnostiquer certaines pathologies à partir de radiographies ou IRM. Elle est d’ailleurs déjà utilisée par les médecins dans la détection précoce du cancer du sein suite à des mammographies. Et ce n’est qu’un début... tri des déchets, reconnaissance faciale, aide à l’arbitrage dans le sport, nombreux sont les champs d’application de la technologie.

 

L’Intelligence Artificielle vous intéresse ? Le secteur propose de belles carrières avec de nombreux métiers passionnants. Découvrez nos formations en Data et Développement Web.