Plasticité fonction du temps d'occurrence des impulsions

Un article de Wikipédia, l'encyclopédie libre.

La plasticité fonction du temps d'occurrence des impulsions (en anglais : Spike-timing-dependent plasticity, STDP) est un processus de modification du poids des synapses. Cette modification dépend du moment de déclenchement du potentiel d'action dans les neurones pré- et post-synaptique. Ce processus permettrait d'expliquer partiellement le développement cérébral et la mémorisation, en provoquant potentialisation à long terme (en anglais : Long-term potentiation, LTP) et dépression à long terme (en anglais : Long-term depression, LTD) des synapses.

Processus[modifier | modifier le code]

Mise à jour des poids synaptiques entre deux neurones, en fonction de leur temps d'occurrence des impulsions, avec la STDP biologique ().

La STDP est une interprétation de la théorie de Hebb, souvent résumée par la formule : « des neurones qui s'excitent ensemble se lient entre eux. ». L'objectif de ce mécanisme de plasticité est de renforcer les connexions synaptiques où les activations du neurone pré-synaptique mènent aux activations du neurone post-synaptique et de diminuer les connexions où le neurone pré-synaptique n'a pas d'influence sur les activations du neurone post-synaptique[1].

Modélisation[modifier | modifier le code]

La STDP s'implémente dans les réseaux de neurones à impulsions pour modéliser un processus d'apprentissage non supervisé et local (c'est-à-dire que la mise à jour des poids synaptiques ne dépend uniquement que des deux neurones reliés). Elle permet aux réseaux de neurones d'apprendre, sans supervision, des caractéristiques propres aux données d'entrées[2],[3],[4],[5].

Différentes implémentations existent[6], plus ou moins fidèles aux observations biologiques, et leur utilisation varie selon les besoins, l'architecture du réseau ou encore le modèle de neurone utilisé.

Règle biologique[modifier | modifier le code]

La règle biologique est la plus proche du mécanisme de plasticité observé dans notre cerveau. La mise à jour des poids d'une connexion synaptique dépend de la différence entre les temps d'occurrence des impulsions et peut se formuler de la manière suivante :

avec les poids synaptiques, et les taux d'apprentissages, et les temps d'occurrences des impulsions des neurones pré et post-synaptiques, et la constante de temps.

Règle additive[modifier | modifier le code]

Une simplification de la règle biologique peut être réalisée en s'abstrayant des temps exacts d’occurrences des impulsions :

Cette simplification dépend uniquement du signe de , ce qui permet notamment de diminuer la complexité de calcul.

Règle multiplicative[modifier | modifier le code]

Une autre adaptation de la STDP améliore la règle additive en ajoutant des termes pour contrôler la saturation des poids[7] :

avec le facteur de saturation, le poids de la connexion, et les valeurs minimum et maximum des poids.

Cette règle peut aussi se formuler de la manière suivante, où la saturation des poids est contrôlée par le terme [2],[3],[8] :

À noter que, si le modèle de synapse utilisé n'intègre pas de délai synaptique, il peut être judicieux de considérer pour la potentialisation à long terme. Dans ce cas, les neurones pré-synaptiques qui s'activent en même temps que le neurone post-synaptique contribuent à son activation. De plus, de nombreux travaux[2],[3],[5],[8] appliquent la dépression à long terme pour les connexions où le neurone pré-synaptique ne s'active pas, considérant donc son temps d'occurrence .

Modulation par la récompense[modifier | modifier le code]

De nombreuses études suggèrent que le système de récompense de notre cerveau joue un rôle important dans notre apprentissage. Notamment, certaines montrent que ce système utilise la dopamine pour modifier la polarité de la plasticité synaptique[9] ou encore pour prédire les futures récompenses d'une action[10].

La STDP modulée par la récompense (en anglais : reward-modulated STDP, R-STDP)[11] est une interprétation de la plasticité synaptique qui permet de prendre en compte le rôle du système de récompense de notre cerveau. Ce mécanisme de plasticité, similaire à la STDP, intègre un processus permettant de moduler ou même de changer le signe de la mise à jour des poids synaptiques.

Notes et références[modifier | modifier le code]

  1. (en) Henry Markram, Wulfram Gerstner et Per Jesper Sjöström, « Spike-Timing-Dependent Plasticity: A Comprehensive Overview », Frontiers in Synaptic Neuroscience, vol. 4,‎ (ISSN 1663-3563, PMID 22807913, PMCID PMC3395004, DOI 10.3389/fnsyn.2012.00002, lire en ligne, consulté le )
  2. a b et c (en) Paul Ferré, Franck Mamalet et Simon J. Thorpe, « Unsupervised Feature Learning With Winner-Takes-All Based STDP », Frontiers in Computational Neuroscience, vol. 12,‎ (ISSN 1662-5188, PMID 29674961, PMCID PMC5895733, DOI 10.3389/fncom.2018.00024, lire en ligne, consulté le )
  3. a b et c (en) Meng Dong, Xuhui Huang et Bo Xu, « Unsupervised speech recognition through spike-timing-dependent plasticity in a convolutional spiking neural network », PLOS ONE, vol. 13, no 11,‎ , e0204596 (ISSN 1932-6203, PMID 30496179, PMCID PMC6264808, DOI 10.1371/journal.pone.0204596, lire en ligne, consulté le )
  4. (en) Chankyu Lee, Priyadarshini Panda, Gopalakrishnan Srinivasan et Kaushik Roy, « Training Deep Spiking Convolutional Neural Networks With STDP-Based Unsupervised Pre-training Followed by Supervised Fine-Tuning », Frontiers in Neuroscience, vol. 12,‎ (ISSN 1662-453X, PMID 30123103, PMCID PMC6085488, DOI 10.3389/fnins.2018.00435, lire en ligne, consulté le )
  5. a et b (en) Pierre Falez, Pierre Tirilly, Ioan Marius Bilasco et Philippe Devienne, « Multi-layered Spiking Neural Network with Target Timestamp Threshold Adaptation and STDP », 2019 International Joint Conference on Neural Networks (IJCNN), IEEE,‎ , p. 1–8 (ISBN 978-1-7281-1985-4, DOI 10.1109/IJCNN.2019.8852346, lire en ligne, consulté le )
  6. (en) Alex Vigneron et Jean Martinet, « A critical survey of STDP in Spiking Neural Networks for Pattern Recognition », 2020 International Joint Conference on Neural Networks (IJCNN), IEEE,‎ , p. 1–9 (ISBN 978-1-7281-6926-2, DOI 10.1109/IJCNN48605.2020.9207239, lire en ligne, consulté le )
  7. (en) M. C. W. van Rossum, G. Q. Bi et G. G. Turrigiano, « Stable Hebbian Learning from Spike Timing-Dependent Plasticity », Journal of Neuroscience, vol. 20, no 23,‎ , p. 8812–8821 (ISSN 0270-6474 et 1529-2401, PMID 11102489, PMCID PMC6773092, DOI 10.1523/JNEUROSCI.20-23-08812.2000, lire en ligne, consulté le )
  8. a et b (en) Timothée Masquelier et Simon J. Thorpe, « Unsupervised Learning of Visual Features through Spike Timing Dependent Plasticity », PLOS Computational Biology, vol. 3, no 2,‎ , e31 (ISSN 1553-7358, PMID 17305422, PMCID PMC1797822, DOI 10.1371/journal.pcbi.0030031, lire en ligne, consulté le )
  9. (en) Geun Hee Seol, Jokubas Ziburkus, ShiYong Huang et Lihua Song, « Neuromodulators Control the Polarity of Spike-Timing-Dependent Synaptic Plasticity », Neuron, vol. 55, no 6,‎ , p. 919–929 (ISSN 0896-6273, PMID 17880895, PMCID PMC2756178, DOI 10.1016/j.neuron.2007.08.013, lire en ligne, consulté le )
  10. (en) Wolfram Schultz, « Predictive Reward Signal of Dopamine Neurons », Journal of Neurophysiology, vol. 80, no 1,‎ , p. 1–27 (ISSN 0022-3077 et 1522-1598, DOI 10.1152/jn.1998.80.1.1, lire en ligne, consulté le )
  11. (en) Nicolas Frémaux et Wulfram Gerstner, « Neuromodulated Spike-Timing-Dependent Plasticity, and Theory of Three-Factor Learning Rules », Frontiers in Neural Circuits, vol. 9,‎ (ISSN 1662-5110, PMID 26834568, PMCID PMC4717313, DOI 10.3389/fncir.2015.00085, lire en ligne, consulté le )


Voir aussi[modifier | modifier le code]