Max pooling

Un article de Wikipédia, l'encyclopédie libre.

En apprentissage automatique, la couche de max pooling ou max-pooling[1] est une des quatre couches dans un réseau de neurones convolutif. Cette couche permet de sous-échantillonner une image lors de sa classification par un réseau de neurones. Le but de cette couche est de réduire la taille des images sans modifier les features importantes de cette image.

Procédé[modifier | modifier le code]

La couche Max-pool va prendre en entrée des listes de caractéristiques et en fonction de la taille que l'on souhaite va retourner une matrice de taille choisie. Pour ce faire, l'image va être découpée.

Exemple de Maxpooling 2x2.

Max-Pool 2x2 va rendre une matrice de taille 2x2, Max-Pool 3x3 va rendre une matrice de taille 3x3. L'image va être séparée en zone égale, Max-Pool va alors garder seulement la valeur maximale.

La matrice de sortie possède le même nombre de caractéristiques[pas clair] de celle en entrée (dans l'exemple ci-contre 4) mais le max-pool n'a conservé que les valeurs maximales.

Cette couche permet donc de réduire le nombre de paramètres et donc de calcul dans le réseau de neurones. Il y a donc une augmentation de l'efficacité du réseau et nous évitons ainsi le sur-apprentissage par le réseau de neurones[réf. nécessaire].

Notes et références[modifier | modifier le code]

  1. (en) Neural Networks and Deep Learning (DOI 10.1007/978-3-319-94463-0, lire en ligne), p. 120