Sommaire

Acquisition de Données d’apprentissage:acquisitiondonnées d’apprentissage

Comme pour tout apprentissage, nous devons disposer de données. La machine devra être capable de faire la distinction entre une cerise et un abricot à partir du poids et de la taille de chaque fruit. La première option qui s’offre à nous est de nous rendre chez un marchand de fruits, de prendre les mesures nécessaires pour chaque fruit et de les répertorier dans un document. Ce travail est assez fastidieux.

Il existe cependant une seconde option. Comme vous le savez sans doute, les caractéristiques des fruits sont "normalisées". Ainsi des normes existent pour définir la taille et le poids minimaux et maximaux d’une cerise, idem pour les abricots. C’est donc à partir de ces normes que nous allons constituer notre jeu de données en générant aléatoirement des fruits.

Pour récupérer ces normes, une simple recherche sur Internet suffit, ce qui nous a permis de constituer les tableaux suivants :

(source : http://www.crenoexpert.fr/flipbooks/expproduit/TABLEAUX-CALIBRES-FRUITS-2.pdf).

Les cerises :

Diamètre minimal (mm)

Diamètre maximal (mm)

Poids minimal (g)

Poids maximal (g)

17

19

1

5

20

21

5

6

22

23

6

7

24

25

7

8,5

26

27

8,5

10

28

29

10

11,5

Les abricots :

Diamètre minimal (mm)

Diamètre maximal (mm)

Poids moyen (g)

35

39

27

40

44

41

45

49

54

50

54

74

55

59

100

Un petit script Python pour nous ...