lundi, 2 mars 2020
Des stratégies bottom up et top down pour prédire au mieux ce qui vient
La prochaine séance du cours «Notre cerveau à tous les niveaux» donné en collaboration avec l’UPop Montréal au café Les Oubliettes aura lieu ce mercredi le 4 mars. Comme je le mentionnais dans mon billet de la semaine dernière, après avoir résumé lors des séances précédentes la longue évolution qui a mené jusqu’au cerveau humain, on constatera que « Tout ce qui précède permet de simuler le monde pour décider quoi faire ». C’est-à-dire trouver de quoi boire, de quoi manger et, si possible, un.e partenaire pour se reproduire. Et tout en évitant, autant que possible, les dangers et autres menaces pour notre intégrité physique. Pour cela, nous aurons autant besoin de réagir aux possibilités d’action immédiates que nous suggère notre environnement (les fameuses « affordances » décrites la semaine dernière) que de faire des plans plus élaborés impliquant une connaissance approfondie du comportement des autres dans la culture particulière qui est la nôtre. C’est sur ces multiples niveaux où peuvent être sélectionnées nos actions que j’aimerais attirer votre attention cette semaine.
J’ai eu l’occasion de l’écrire ici en présentant Karl Friston, notre cerveau est une machine à faire des prédictions qui s’appuie sur des modèles internes construits tout au long de notre longue histoire, à la fois évolutive et développementale. Ces modèles statistiques construits à partir de nos interactions avec les régularités du monde constituent le principal signal qui nous permet de percevoir ce monde. En d’autres termes, ce n’est pas tant ce qui est capté par nos sens et qui « monte » dans le cerveau qui est l’activité dominante de celui-ci, mais plutôt ce qui « descend » ou est projeté sur le monde à partir de nos modèles internes. C’est l’idée générale du « predictive processing », un cadre théorique général du fonctionnement cérébral de plus en plus considéré depuis une décennie ou deux.
Or si nos réseaux cérébraux sont devenus capables, souvent après des années d’apprentissage, de formuler de bonnes hypothèses quant à la nature du réel, le monde est d’une telle richesse et d’une telle imprévisibilité qu’il arrive souvent qu’on se trompe sur son état. Autrement dit, l’on se rend compte qu’il y a un écart entre les indices sensoriels qui montent dans le système et nos prédictions « descendantes » sur l’état du monde. Et donc ce que le cerveau va chercher constamment à faire pour maintenir le corps qui l’héberge dans un état viable, c’est de réduire cet écart entre nos modèles internes et le monde. Et il peut toujours le faire de deux façons : modifier les modèles pour qu’ils deviennent mieux adaptés au monde, ce qu’on appelle couramment l’apprentissage; ou bien, si l’on est convaincu que notre modèle est bon, changer le monde pour qu’il s’y conforme, c’est-à-dire agir pour transformer le monde et le rendre plus compatible avec notre modèle. Dans les deux cas, il est donc question de réduire ou de minimiser un écart entre le monde tel qu’il se dévoile à nous et nos modèles statistiques préalables sur celui-ci.
Or cette minimisation de l’écart (ou de l’erreur sur la prédiction) ne se fait pas à un seul endroit dans le cerveau. Celui-ci est en effet un système complexe comportant de nombreux niveaux d’organisation et c’est à chacun de ces niveaux que la minimisation d’erreur va se faire constamment. Il importe de rappeler ici qu’il n’y a pas un nombre précis de ces niveaux; ils peuvent être définis par un observateur scientifique en fonction de ce qu’il veut étudier.
Une façon fréquente de les représenter c’est par des cercles concentriques comme ceux sur la figure en haut de ce billet. Les plus grands cercles représentent ainsi les aires cérébrales plus proches du monde extérieur, donc les aires corticales sensorielles et motrices. À l’opposé, plus les cercles sont petits et centraux, plus les neurones situés à ces niveaux sont impliqués dans des processus de haut niveau et ont des chances d’être multimodaux (de réagir à plusieurs modalités sensorielles). Le réseau du mode par défaut, avec ses nombreuses zones impliquées dans nos différents cortex associatifs, se situerait par exemple dans cette région centrale.
Or ce sur quoi j’aimerais attirer votre attention aujourd’hui concerne la grande flexibilité que l’on observe au sein de ces multiples niveaux lors de nos interactions quotidiennes avec le monde. Prenons d’abord l’exemple de la prise de décision telle que décrite dans le cadre de la théorie de la compétition d’affordance présentée la semaine dernière. Cette idée, donc, que notre cerveau présélectionne constamment des groupes de neurones qui augmentent leur activité en fonction des possibilités d’action du moment. Et par un jeu d’inhibitions réciproques entre ces groupes, l’activité nerveuse au sein d’une assemblée de neurone particulière va devenir prédominante et dicter à l’organisme le geste à poser, l’objet à saisir, la direction où aller, etc.
Mais si la compétition d’affordances a été initialement conçue comme une théorie décrivant comment un animal sélectionne des actions concrètes et immédiates, elle peut aussi être étendue vers une théorie plus générale de décisions prises à de multiples niveaux d’abstraction. La proposition clé qui permet de franchir ce pas est de reconnaître la capacité du cerveau à prédire les conséquences d’actions, ce qui lui permet de faire des liens à différents niveaux d’abstraction et d’influencer des actions en cours avec des opportunités à plus long terme qu’elles rendent possibles.
Ainsi, pour quelqu’un qui fait de l’escalade, la bonne façon d’agripper une prise dépend de la prise suivante qu’il veut atteindre et, ultimement, du trajet de sa voie pour se rendre au sommet. Donc les premiers mouvements ne se conçoivent pas en vase clos mais vont servir à créer les meilleures affordances possibles pour les mouvements suivants.
D’où l’idée d’un “paysage d’affordances” qui découle de cette vision des choses, c’est-à-dire un ensemble d’affordances qui se déploie dans le temps et l’espace et varie en fonction de l’environnement ET des actions de l’agent dans cet environnement. Par exemple ici de l’interaction constante entre le grimpeur et la paroi. Ce paysage d’affordances peut être improvisé au fur et à mesure de l’ascension, mais il peut aussi, au moins en partie, être planifié avant de commencer à grimper. Le grimpeur doit alors prédire la séquence d’affordances qui ne sont pas directement disponibles mais peuvent être imaginées mentalement.
Qui dit imagination dit donc aussi processus de haut niveau, donc quelque chose qui émanerait des cercles concentriques les plus petits de notre schéma. Dans le jargon des sciences cognitives, on pourrait aussi dire quelque chose de très « top down » (par opposition au « bottom up » en provenance de l’environnement qui correspondrait plus aux cercles les plus grands). Il peut donc y avoir des processus de sélection d’affordance qui se font d’abord à des hauts niveaux d’abstraction où l’on sélectionne par exemple un but ou un objectif général. Constatant que vous n’avez plus de lait dans le frigo, ce pourrait être par exemple d’aller à l’épicerie. Pourrait alors s’ensuivre une sélection d’affordances disponibles immédiatement au niveau le plus bas, par exemple ouvrir sa porte pour sortir de sa demeure. Et puis, chemin faisant, une succession de sélections intermédiaires vont s’enchaîner (localiser l’épicerie, trouver la bonne allée, et finalement prendre un litre le lait).
Cette navigation intentionnelle dans un “paysage d’affordances” nécessite donc une flexibilité comportementale. Un autre exemple serait celui du boxeur qui veut frapper un opposant. Il doit d’abord s’approcher de lui pour rendre l’affordance de “frappabilité” disponible. Mais s’il s’approche trop et devient lui-même vulnérable, il doit reculer pour les même raisons. Les couches supérieures qui encodent des buts plus abstraits (donner un coup au visage) envoient des commandes top-down pour les couches inférieures (maintenir la distance d’un bras avec l’adversaire), ce qui va favoriser le surgissement d’affordance pour les niveaux inférieurs (une baisse de la garde de l’opposant qui rend momentanément son visage vulnérable, par exemple).
Autrement dit, les niveaux supérieurs orientent la compétition aux niveaux inférieurs mais leur laissent ultimement une autonomie significative dans la sélection d’action selon le détail des affordances disponibles. Car il peut très souvent y avoir différentes façons de spécifier (d’actualiser) les demandes des niveaux supérieurs. On est donc dans quelque chose de très différent de la vision classique où les niveaux supérieurs spécifient complètement un comportement, incluant les commandes nécessaires aux niveaux inférieurs en les décomposant en sous-unités (ex.: les mouvements des bras, de la main, des doigts, etc.)
On retrouve cette flexibilité entre la prépondérance de l’influence top down ou bottom up dans les processus attentionnels tels que redéfinis dans le cadre du « predictive processing ». Dans cette perspective, l’attention est modélisée en tant que ‘precision-weighting’, c’est-à-dire un échantillonnage favorisant les données sensorielles qui ont la plus haute précision. Autrement dit, les “prediction error” qui ont un ratio “signal / bruit” élevé.
En se basant sur cette information, le système cognitif balance le gain (ou ‘volume’) de ce qui est transmis entre les différents niveaux en fonction de la précision du signal.
Dans certains cas, on pourra par exemple complètement couper les influences de haut niveaux et avoir une stratégie quasiment 100% bottom up. C’est ce qui se passe par exemple par une belle journée où l’air frais et sec offre une très bonne visibilité. On peut alors s’en remettre en toute confiance à notre vision, donc à une source d’information très bottom up.
Dans des situations où il y a toutefois une grande incertitude en provenance de l’environnement (une journée très brumeuse, par exemple), un poids plus grand pourra être apporté aux modèles internes (« prior probabilities »). Autrement dit, aux souvenirs que l’on a de cette route où l’on ne voit pas loin aujourd’hui et où l’on doit donc anticiper les virages.
Même chose au niveau sonore : dans un party bruyant où l’on entend à peine la personne qui nous parle, on va s’en remettre beaucoup à des connaissances implicites (donc au top down, aux « priors »…) pour compléter les mots qu’on manque et comprendre ses phrases.
On voit donc que notre cerveau est prédictif, mais pas d’une manière absolue. Il est très bon pour donner du sens aux signaux incomplets ou ambigus – qui sont la norme dans la vie de tous les jours – mais peut aussi également dans d’autres circonstances laisser monter un signal bottom up clair qui pourra mettre à jour nos modèles internes du monde s’ils en ont besoin.
Dormir, rêver..., Le bricolage de l'évolution | Comments Closed