Sommaire

Une Imageimage, c’est quoi ?

La question posée formant le titre de cette section semble évidente. Tout le monde sait ce qu’est une image, qu’elle soit imprimée sur papier, juste devant nos yeux, ou affichée sur un écran. Pourtant, quand il s’agit de technologie, la notion d’image devient plus floue, si j’ose dire. Il est ainsi impossible de faire traiter correctement une image par un ordinateur sans en comprendre les composants, en particulier quand elle doit être transformée en "numpy array" pour l’injecter dans un modèle d’apprentissage profond.

Tout d’abord, regardons rapidement ce qu’est une image fixe et une image vidéo pour être à l’aise quand il s’agira d’en effectuer un traitement.

Mon objectif n’est pas ici de décrire tous les cas possibles, mais ceux les plus fréquents. Ainsi, je me limite aux images et aux vidéos 2D. Les images 3D ou stéréoscopiques ne sont, généralement, que des extensions d’images 2D, et de ce fait ne sont que des matrices de dimensions supérieures. Par exemple, un pixel (picture element) en 2D devient un voxel (volume element) en 3D, c’est-à-dire une matrice décrivant le volume de chaque point.

1. Composantes d’une image fixe

Si vous vous approchez suffisamment près d’une image numérique, vous verrez qu’elle est composée de petits points que l’on ...