Colloque de Royaumont

"Pour une approche scientifique de la psychosomatique".

Actes publiés dans le Bulletin de l'Ecole Lacanienne de Psychosomatique n°1


LA THEORIE DE L'INFORMATION ET LA RECONNAISSANCE (automatique) DES FORMES



Pr J.P. ADOUL

Mon sujet peut vous paraitre assez en dehors des considérations de ce matin .
On m'a demandé de vous dire quelques mots sur la théorie de l'information et j'ai suggéré d'y ajouter quelques mots sur une science de l'ingénieur qui s'appelle la reconnaissance automatique des formes et, dans un dernier temps, j'essaierai, en tant qu' ingénieur des télécommunications de suggérer un modèle pour étudier un type de communication particulier : la communication mère-enfant.
Je vais faire usage de ce rétroprojecteur qui me permettra j'espère, de communiquer avec vous plus efficacement .
La théorie de l'information est une théorie essentiellement mathématique qui a pris sa naissance avec les articles d'un mathématicien américain : Claude SHANNON, dans les années 1948 . En effet, pendant les années d'après-guerre, les philosophes et les ingénieurs des télécommunication, s'interrogeaient sur la nature de l'information et il y eu donc un travail fondamental qui a été produit par ce chercheur et qui a donné naissance en fait à une discipline SHANNON est le chercheur qui a introduit la notion d'entropie qui est connue pour être une mesure du désordre ; mais rapidement la théorie est devenue une spécialité mathématique qui avait des applications très précises dans les télécommunications. Malgré de nombreux articles qui ont essayé de tirer des interprétations de la notion d'entropie, il s'est créé un gouffre entre les gens qui parlaient de la théorie de l'information dans un sens très métaphorique et très large, et les professionnels de la théorie de l'information. Tant et si bien que l'un des pionniers , avec un certain mépris, reliait tout ce genre d'articles sous le titre de : " La théorie de l'information : de la photosynthèse à la religion" .
Par la suite la science est devenue assez spécifique sur les problèmes particuliers . Dans le cadre d'une communication voici les trois grands problèmes que cette théorie tente d'aborder.
- d'abord l'aspect quantitatif .
Combien de messages par seconde, de symboles par seconde , puis je transmettre au travers d'un canal hostile ? Je vais revenir sur ce que l'on entend par cette hostilité du canal et donc cette première question a conduit à définir la capacité d'un canal ; c'est à dire que, dans une situation de communication, il y a une limite au delà de laquelle on ne peut plus transmettre dans des conditions fiables. C'est à dire que le message ne peut plus être prémuni contre les aléas du canal de transmission.
La deuxième question que s'est posé SHANNON et ceux qui l'ont suivi, c'est : " Comment puis-je transmettre ? "
De cette question est née la science du codage qui est un art d'introduire une certaine redondance bien pensée dans le message afin que, grâce à cette redondance bien pensée, le message puisse passer intact au travers du canal .
Il y a une troisième question que la théorie de l'information s'est posée, que SHANNON a déjà formulée dans ses articles en 1948, mais qu'il n'a formulée vraiment et résolue que 10 ans plus tard , et qui , dans un sens est largement méconnue, question lièe davantage au contenu du message, c'est la question de savoir : " Que dois je transmettre étant données des ressources limitées ? " C'est ainsi que je suis parmi vous , je n'ai que quelques minutes, et je dois essayer de faire passer la quintessence de ce qu'est la thèorie de l'information. Alors je dois faire un choix, c'est à dire que tout symbole n'est pas associé avec la même richesse d'information, la même qualité d'information. Là il y a vraiment un tournant dans le problème, qui est de reconnaitre à la fois ce qui est bien "désordre" parceque c'est très surprenant, c'est bien aléatoire mais en fait, peut être, ce n'est juste qu'une information inutile et annexe alors que vous avez un seul symbole qui pouvait être important. Par exemple lorsqu'un ingénieur veut transmettre une image de télévision, il a besoin de milliers de ce que l'on appelle les bits . Les bits sont des réponses oui-non à une question implicite ; par exemple quand on fait une image, on passe tous les points de l'image ; s'ils sont blancs on dit "oui" s'ils sont noirs , on dit "non" et la convention c'est qu'on va les passer les uns derrière les autres comme cela . La transmission d'une image de télévision consiste à dire oui-non-oui-oui ..... et l'on reconstitue ces réponses au récepteur et l'on a une image . Mais en fait la science qui correspond à dire : " que dois-je transmettre ?" se penche sur le problème suivant : reprendre cette information qui prend des millions de questions réponses et peut être poser de meilleures questions . Peut être la première question que l'on pourrait poser sur l'image serait : " Y a t'il une personne ou non dans cette image? "
Eh bien là, la première réponse oui-non est chargée de qualité d'information qui est sans comparaison avec la première réponse qui consistait à dire : " Dans le point en haut et à gauche, est ce que c'est blanc ou est ce que c'est noir ? "
Il y a un nouveau problème, je ne pourrai pas malheureusement rentrer dans les détails, mais ce que je vais essayer de faire plutôt , c'est de démystifier certains abus de la conception d'entropie, montrer que cela s'applique au moins à trois situations particulières .
Avant de passer à cela, je voudrais donner une illustration de ce qu'est que qu'un canal pour le théoricien de l'information ..........
C'est au fond le chemin par lequel les symboles porteurs de message sont acheminés et qui peuvent de temps en temps créer des perturbations . Alors ici j'ai pris deux symboles au lieu de prendre des 0 et des 1 comme les ingénieurs, j'ai pris un sourire et une grimace et alors vous voulez transmettre un sourire ou une grimace et donc , sous jacent à toute transmission, il y a une question implicite, que à la fois le transmetteur et le récepteur sont en train de considérer, et la communication est l'apport de la réponse à cette question . Par exemple, vous avez une légende ici : sourire, cela veut dire OUI et grimace cela veut dire NON, alors un canal qui est hostile, c'est un canal qui la plupart du temps transmet correctement, mais dans certains cas , il y a une perturbation dans le canal alors il y a plusieurs sortes de canals.
L'entropie , c'est une mesurre d'un désordre et en théorie de l'information et dans l'emploi de ce terme, il apparait dans trois situations que je trouve assez disjointes .
Le numéro 1, c'est l'idée du canal , l'entropie que l'on désigne par H depuis SHANNON est liée dans ce cas à la probabilité de se tromper de canal . L'entropie, dans ce contexte, mesure le désordre du canal et plus il y a d'entropie, plus il y a de désordre dans le canal et la capacité de communiquer par ce canal hostile va être diminuée par cette quantité d'entropie . Si on shématise, le canal aurait une certaine capacité s'il était parfait, s'il n'y avait aucune erreur, et à cause de cet aléa, sa capacité se trouve être amenuisée par une quantité que l'on appelle l'entropie . Voilà le premier sens que prend ce terme d'entropie .
La deuxième situation, c'est la situation qui prévaut peut être dans le cas du nouveau né , où le premier type d'apprentissage qui prend place chez le nouveau né est un apprentissage de système de régulation pourrait-on dire, c'est à dire , il entend MARION, Marion, Marion,....... il va finir par réagir à ce terme de Marion c'est à dire que l'on a affaire maintenant à une séquence ou à une forme, je l'ai mise ici sous une forme de séquence de 0 et de 1 et je suis sür que vous êtes tous assez brillants ici pour avoir une bonne idée à priori du symbole qui va arriver dans le point d'interrogation ; si vous êtes capables de trouver que c'est un 1 qui arrive, c'est que vous faites appel à une inférence qui est fondamentale chez tous les êtres intelligents, c'est de prendre le passé comme point d'appui pour inférer sur l'avenir. On a donc affaire à une séquence qui n'est pas porteuse d'information, au sens de communication entre deux individus, ou deux agents mais c'est une forme intrinsèque , c'est à dire que si vous entendez de l'eau qui coule de façon aléatoire dans la salle de bain, cela vous dérange moins que si cela goutte régulièrement, car là tout votre système nerveux commence à rentrer en vibration et cela vous fait lever pour aller fermer le robinet . Il y a une structure insupportable et cette structure, si on la mesure en terme d'entropie, c'est une défaillance d'entropie à tel point que les philosophes l'ont appellée néguentropie. La séquence est dépouillée de prédiction , elle a une stucture très forte , c'est une forme particulière qu'il faut distinguer d'un échange entre personnes qui se parlent.
Dans la troisième situation, il y a vraiment échange entre agents, il y a un éco-système qui s'est formé entre personnes qui se parlent et qui se parlent au moyen de symboles qui sont porteurs de messages. J'ai distingué symbole de message parce qu'en fait un message, c'est l'association d'un symbole par rapport à un référentiel sémantique, c'est à dire à une question comme dans le cas de la télévision, la question pouvait être : " quelle est la couleur du point en haut et à gauche ? ", ou alors, des gens qui savent mieux transmettre la télévision en moins de questions OUI-NON vont partir à l'envers, vont dire " Y a t'il une personne dans l'image , OUI ou NON ?", " S'il y a une personne dans l'image, est ce que c'est un homme ou une femme ? "
C'est à dire qu' en théorie de l'information, la meilleure façon de transmettre c'est d'être capable d'avoir une séquence de questions à préalable, qui est tacitement entendue entre transmetteur et récepteur et qui, si vous transmettez de façon très efficace va d'ailleurs dépendre des réponses précédentes . Par exemple, si l'on veut être très efficace on va dire : " Est ce qu'il y a un homme ou une femme ? " et là on va brancher de façon arborescente : " Si c'est une femme, est ce qu'elle a les cheveux courts ?", Et alors, le récepteur, qui est de connivence, lorsque il va recevoir les symboles, va être capable de comprendre une idée de ce que l'on veut transmettre .
C'est tout ce que je compte dire sur la théorie de l'information et je vais décrire encore plus rapidement une autre science connexe . En fait, dans un groupe de théoriciens de la communication , il y a toujours des partisans de la reconnaissance des formes . Le lien entre les deux, est surtout la formulation statistique des problèmes . Le but de la reconnaissance des formes, qui est une branche de l'intelligence artificielle, se décompose en deux objectifs, celui de comprendre l'intelligence et celui de faire des artifices pour impressionner la clientèle.
Grace aux machines de traitement de l'information, on a des joujous pour pouvoir essayer des idées et donc par ce biais là, de chercher des métaphores intéressantes pour trouver les éléments de l'intelligence.
Le chapitre particulier de la reconnaissance des formes est intéressant pour nous parce que l'on essaie de trouver une boite qui fait le lien entre des observations multidimensionnelles ou multisensorielles, comme on dit dans le milieu et d'autre part d'élaborer des échelles au niveau du cognitif, c'est à dire arriver à donner des noms de symboles, à attribuer des symboles à des formes et des objets, à des sons , à ce qui circule dans la nature ; Le but est donc de classifier, c'est à dire de faire des machines capables de reconnaitre le chiffre 6 par rapport au chiffre 4 même si le chiffre 6 a été écrit de façon manuscrite; on va donc essayer de définir la forme ou ce que c'est que l'essence d'un 6 par rapport à un 4 et vous avez différents types ; les deux plus grandes catégories de disciplines sont des catégories de type statistique dans lesquelles on essaie de trouver, de déceler les invariants statistiques dans les objets que l'on est en train de regarder et l'approche syntaxique qui essaie de trouver les règles de grammaire sous jacentes.
Ici, je vais essayer de décrire le paradigme fondamental de la reconnaissance des formes statistique : vous voulez reconnaitre les personnages qui rentrent ici à l'Abbaye et vous avez une possibilité multisensorielle d'entrées . Vous avez une première boite qui extrait des traits ou des paramètres significatifs . En fait la science de la reconnaissance des formes est extrèmement pauvre sur ce qu'il faudrait mettre dans cette boite et lorsque l'on fait des systèmes réels, c'est souvent le génie humain qui assiste , qui dit " Voilà les traits fondamentaux qu'il faudrait utiliser . "
Ce qui est important ici : à l'entrée, c'est multisensoriel et à la sortie on l'a ramené à un plus petit nombre de traits ; c'est pour cela que l'on appelle aussi cette opération, une réduction de dimension ; c'est à dire que vous avez tellement de dimensions que c'est impalpable, c'est trop complexe ; là dedans, il faut trancher , il faut voir maintenant quels vont être les traits fondamentaux . Je me suis livré à ce petit exercice ici et j'ai trouvé que pour reconnaitre les gens qui venaient à l'Abbaye de Royaumont, il fallait considérer l'âge et le salaire et puis l'apprentissage a été fait avec un maître, c'est à dire qu'en fait ma machine essaie de reconnaitre les gens qui passent sur la base de leur salaire et de leur âge, mais il y a un maître dans la pièce qui sait d'avance si c'est quelqu'un de l'Ecole Lacanienne ou pas . Alors on a mis en rouge les gens qui sont passés par l'Ecole Lacanienne et on a trouvé effectivement qu'il y avait dans cet espace réduit, les lacaniens se trouvent dans ce groupe ici et ceux qui voudraient l'être ou qui sont extérieurs sont dans le groupe de l'autre coté . Ce que je veux faire ressortir de ce paradigme, c'est que si vous ne considérez pas assez de dimensions, si vous considérez seulement le salaire, vous avez ambiguité parceque si l'on projette tout le monde sur le salaire, on voit ici qu'il y a un lacanien qui gagne autant qu'un non lacanien. Si vous regardez l'àge, de nouveau vous n'avez aucune possibilité de distinguer les deux groupes . Par contre la vertu de considérer plusieurs dimensions simultanément est l'essence de la reconnaissance des formes : c'est être capable d'intégrer plusieurs informations simultanément . C'est la propriété intégrative de ces machines qui permet d'arriver à donner un nom . Ici il est clair que vous avez des groupes naturels qui vont se produre et pour la machine, il suffira donc de mettre un seuil ici , et sans aucune erreur, il sera capable de discerner l'origine de la personne qui entre .
Deuxième situation fondamentale , c'est le cas de l'apprentissage sans maitre.
Dans ce cas, la machine est laissée à elle mème . C'est une situation extrèmement difficile ; d'abord, c'est une situation que l'on ne sait pas vraiment faire, on a eu de ce coté là des déboires assez retentissants mais l'idée c'est que l'on va essayer de se représenter le phénomène et, à un moment donné va apparaitre la notion de groupe, c'est à dire de choses liées, où émerge une certaine resemblance est l'essence de la reconnaissance des formes : c'est être capable d'intégrer plusieurs informations simultanément . C'est la propriété intégrative de ces machines qui permet d'arriver à donner un nom . Ici il est clair que vous avez des groupes naturels qui vont se produire et que, pour la machine, il suffira donc de mettre un seuil ici , et sans aucune erreur, il sera capable de discerner l'origine de la personne qui entre .
Deuxième situation fondamentale , c'est le cas de l'apprentissage sans maitre.
Dans ce cas, la machine est laissée à elle mème . C'est une situation extrèmement difficile ; d'abord, c'est une situation que l'on ne sait pas vraiment faire, on a eu de ce coté là des déboires assez retentissants mais l'idée c'est que l'on va essayer de se représenter le phénomène et, à un moment donné va apparaitre la notion de groupe, c'est à dire de choses liées, où émerge une certaine resemblance . Par exemple ici vous trouverez une certaine ressemblance entre âge et salaire .
Mais quelqu'un d'autre va entrer dans la salle ; il va voir trois groupes, un autre va voir quatre groupes .
Ici vous nagez d'avantage dans l'arbitraire, et au fond , c'est le problème de la taxinomie, c'est à dire que si l'on voulait reprendre à zéro, redonner des noms de fleurs à toutes les fleurs de la terre, on pourrait les prendre toutes et mesurer la longueur des pétales dans un espace multidimensionnel et dire : " les botanistes se sont trompés, ils ont multiplié les nombres, nous allons reprendre tout cela à zéro et essayer de voir quels sont les groupes naturels " ; autrement dit on essaye de faire des systèmes qui vont être capables d'accrocher sur une structure qui est déjà présente dans le monde . C'est une forme de communication, si vous voulez , mais ce n'est pas le mème genre de communiccation que la communication qu'il y a entre deux agents .
Je vais essayer peut être de façon tres naïve de montrer quelle est la façon de voir d'un ingénieur des télécommunications, quel genre de modèle je pourrais suggérer . Ici on a étudié la communication entre personnes, c'est ce qui nous intéresse le plus et ce qui, je crois, est fondamental dans cete situation : si un ingénieur des communications avait le loisir d'observer les opérations de près, il ferait à mon avis la constatation suivante : la première personne va émettre une idée, par exemple : "Tiens le temps est à la pluie ! ", et l'autre personne de l'autre coté va l'entendre . Si on fait de la psychologie beaucoup trop simpliste, on va attendre une réponse de l'organisme immédiate et on va être déçu par ce que ce jour là la personne ne comptait mème pas sortir ; ce qui se passe vraiment, c'est une modification dans la personne mais qui n'est pas forcément liée à des gestes ou à des actions ; mais il y a une modification au niveau de la potentialité d'action de cette personne . C'est pour cela que je suggère le modèle de BOULDING qui consiste à dire: à chaque instant une personne est consciente de qui elle est , où elle est, quelles sont les relations interpersonnelles qu'elle a avec son milieu; elle connait la géographie, l'histoire , un tas de choses et on pourrait prendre l'illustration d'une carte de géographie ; ces cartes de géographie, c'est une façon bidimensionnelle d'établir un certain nombre de liens, de les résumer sous forme d'un dessin ; d'ailleurs on a plusieurs types de cartes de géographie, physique, politique . On peut imaginer que la personne a un certain nombre de façons de stocker, de représenter sa connaissance . La communication va avoir pour effet de modifier possiblement certaines de ces structures et elle va le modifier sous forme de potentialités ; un peu comme lorsqu'on se promène derrière la gare St Lazare : on a toutes les voies de triage et si vous passez le matin ou le soir, vous ne voyez aucune différence et pourtant il y a des potentialité différentes qui ont été imprimées par quelqu'un , et si le trafic arrive vous verrez les trains aller dans différentes directions, un train qui avait l'habitude d'aller sur le quai n° 2 va aller tout à coup sur le quai n° 3 .
C'est un peu ce qui se passe dans le cadre des télécommunications, c'est à dire qu'il y a une modification de cette espèce de carte physique et on peut mesurer la communication comme la modification de ces potentialités ; l'information devrait être reliée à l'étendue de cette modification .
Maintenat évidemment, cette carte contient sans doute des choses que je vais appeller un répertoire, c'est à dire un certain nombre de possibilités et il est possible que la communication tombe tout à fait dans le vide parcequ'il n'y a aucune voie à aiguiller ; ça parle de quelque chose qui n'était pas là au préalable ; on va revenir sur cette question là .
Les ingénieurs de la communication s'intéressent à la notion de distorsion . Cette notion de distorsion , c'est quand vous avez une disparité entre le message qui est reçu et le message que l'on avait l'intention de transmettre . Il est possible aussi, pour un observateur qui aurait accès à ces informations de dire quelle est l'étendue de la distorsion dans la communication et mème on a un canal qui a une certaine hostilité puisqu'on a la possibilité de distorsion.
Ce qui est important dans le cas que nous considérons ce matin, la relation mère enfant, c'est que ce n'est pas vraiment une communcation au sens vrai du terme, c'est une communication avec apprentissage et c'est pourquoi, le modèle devrait être complété . j'ai fait un petit dessin hier soir, c'est un dessin qui essayer à la fois de suggérer une stratification et une hiérarchie . Ce que je veux dire par là et qui a très bien été illustré ce matin , c'est que l'enfant se trouve dans une situation d'apprentissage presqu'à partir de zéro ; pas tout à fait, on l'a vu ce matin, il était capable de tèter sa mère ; donc il avait un certain nombre de spécifications génétiques au départ qui lui ont permis de partir sur la bonne piste et non pas dans le sens interdit . Ces premières expériences vont lui permettre de confirmer ce qu'il a reçu de façon génétique , de l'amplifier, et par une suite d'expérience il devient dapable de rentrer en ecosystème, c'est à dire dans un lien complet avec le monde qui l'entoure et faire ses propres expériences d'essai et d'erreur . Il va être là dans la situation d'apprentissage sans maître, c'est à dire qu'il va être capable d'assimiler la forme du monde et de s'adapter à une forme qui est déjà là préexistante . C'est une communication, si vous voulez, mais ce n'est pas une communication au mème niveau qu'un coup de téphone ; c'est à dire, la forme est là et je prends cette forme et de nouveau la chaine d'expérience qu'il pourra réaliser va lui permette d'avoir les outils, les symboles, les outils conceptuels qui lui permettront d'atteindre un niveau beaucoup plus important où il pourra établir des liens cette fois ci avec le coportement de sa mère et les individus cognitifs à deux pattes qui sont autour ; il va donc avoir les outils pour former un écosystème cette fois ci avec bien sür l'environnement mais surtout avec les parents, cela va être le départ , la mise à feu du langage. On a vu ce matin qu'il y a avait des éléments très importants qui avaient été hérités de bonne heure .
C'est donc une communication mais c'est une communication qui est vraiment très spéciale, qui est dans le cadre d'un apprentissage. Evidemment quand il en arrive à l'âge de l'école, le tranfert de connaissances est breaucoup moins redevable de tous les niveaux inférieurs qui ont étés nécessaires à faire démarrer le processus d'apprentissage de l'acquisition des connaissances .
C'est certainement un shéma qui est bien naïf pour vous qui êtes professionnels de ce genre de choses mais ce que je voulais dire ici, c'est que la théorie de l'information, la reconnaissance des formes a beaucoup plus à donner au niveau mécaniste, c'est à dire à comprendre le mécanisme de l'apprentissage, que d'aller chercher des vertus très profondes dans l'entropie, d'aller chercher des idées formidables qui seraient au niveau de l'électron ou à des niveaux très fondamentaux . Je pense que la communication, j'aurais pu commencer à parler du va et vient de la bouche et de l'onde accoustique qui va créer finalement des impulsions électriques dans les fibres nerveuses, mais j'aurais probablement perdu tellement de temps qu'on n'aurait jamais pu arriver à discuter de ce qui est important . Maintenant, dans les cas pathologiques, lorsque les niveaux s'entremèlent, il est possible qu'il soit utile de retourner à des choses plus fondamentales mais je crois que le grand impact de ces théories, la théorie de la communication, la reconnaissance des formes, l'intelligence artificielle, c'est vraiment de procurer des modèles pour étudier le niveau global .
Ici (cf shémas), j'ai mis quelques troubles de la communication : apprentissage si l'on est capable de faire un seul modèle . Evidemment la modification de la carte peut être mauvaise, il peut y avoir des erreurs d'interprétation, le message peut manquer d'impact précisément parce qu'il n'y a pas les catégories préalables nécessaires pour qu'il y ait une réponse ; c'est un petit peu comme le symbole : si vous avez une clef et que vous vous trompez , vous arrrivez dans votre voiture et vous n'y arrivez pas. Pour un message, cela peut faire la mème chose, le message peut arriver et s'il n'y a pas une adéquation entre ce symbole et le répertoire des possibilités, rien ne se passera . C'est une source de problèmes.
Ce qui est intéressant, c''est que si vous permettez à notre ingénieur de se promener dans ce modèle là il sera capable de dire comme le serrurier pourquoi cela ne marche pas .
C'est comme si vous enseignez le cours moyen à quelqu'un qui est au préparatoire, il y a une inadéquation qui ne marche pas.
Cette idée de carte nous permet d'aller plus loin que la notion du langage .Je pense que comprendre un message, c'est plus que d'être capable d'en extraire la grammaire et de faire le tour de la logique du langage.
Le logique , c'est le chemin vers la meilleure configuration de ma représentation du monde, c'est encore un médium . Le langage n'est pas une fin en soi. Par delà la maîtrise des mots, il y a aussi l'habileté d'exploiter le message reçu pour mettre à jour cette représentation du monde .
Voila de façon très incomplète la présentation que je souhaitais vous faire . J'espère qu'elle sera pour vous une semence d'idées .



Dernière mise à jour : dimanche 5 octobre 2003
Dr Jean-Michel Thurin