13.11.06

Croire ou savoir 22

Note intercalaire

Si j'avais lu plus de philosophes étant jeune, je n'en serais sans doute pas à me poser ces questions; et si, adolescent, j'avais été moins passionné de cinéma et de littérature, j'aurais peut-être pris l'algèbre plus au sérieux (la géométrie me plaisait bien*1, comme je préférais la chimie à la physique, allez savoir pourquoi).

Mais si j'avais fait tout cela, je ne serais sans doute jamais devenu sémanticien (ou, comme disait Bréal, sémantiste), mais ça ne s'est pas fait du jour au lendemain: il a fallu que je m'aperçoive que je n'écrivais pas les histoires qu'on voulait lire. Or il n'y a pas plus grand crime que l'absence de congruence.

Ceci dit, l'infini ne m'a jamais vraiment attiré ou fasciné, même si ce n'est que la possibilité d'ajouter 1 à n. + ∞



Parmi les sujets que je me proposais d’aborder*2, mon choix se portera sur

La pseudo-créativité des sujets parlants I

Omnis nous dit que la créativité (le pseudo est de moi, naturellement) est un concept fondamental de la Grammaire générative. Il s'agit de «l'aptitude du sujet parlant à produire et à comprendre un nombre infini de phrases.»

Le dictionnaire de linguistique Larousse, de Jean Dubois et ses collaborateurs*3, ajoute deux précisions à cette description: «produire spontanément» et «phrases qu'il n'a jamais prononcées ou entendues auparavant».

La distinction que fait ensuite le dictionnaire entre créativité qui change les règles (modifie le système de règles) et la créativité gouvernée par les règles permet d'ouvrir une piste. La deuxième créativité consiste à «produire des phrases nouvelles au moyen des règles récursives de la grammaire».

Le même dictionnaire définit la récursivité comme la propriété de ce qui peut être répété de façon indéfinie, propriété essentielle des règles de la grammaire générative. J'ai déjà signalé le fait que la GG est une adaptation des machines de Turing (il y a des automates de Chomsky)*4.

On pourra un jour se demander avec humour comment une machine a pu «révolutionner» une partie de la linguistique, ou, si l'on préfère, comment l'axiome de Peano (de récurrence) a pu modifier la linguistique structurale de Saussure (jusqu'à la biffer, et renouer avec Descartes!).

Pour l'instant, restons avec notre sujet parlant universalisé («tout») qui, selon Dubois et al., peut comprendre la phrase: «Vous trouverez dans ce dictionnaire environ 1 800 termes définis par une équipe de linguistes.»

On voit d'emblée qu'on ne pouvait pas nous présenter la phrase comme exemple de celle que pourrait produire «tout sujet parlant français». Il n'a aucune idée du nombre de mots définis (dans ce dictionnaire - moi non plus) et n'emploie probablement pas couramment celui de terme. En outre, le citoyen lambda ne connaît sans doute comme sens de linguiste que celui de polyglotte.*5

Mais la compréhension n'est pas plus infinie que les phrases que je peux comprendre. Idem pour la production, qui contrairement à l'idée répandue n'est pas le pendant symétrique, quasi isomorphe, de la compréhension. J'en ai touché un mot en note dans une livraison précédente, et depuis, j'ai retrouvé le petit livre où, bien avant l'impact des travaux de Shannon et Weaver, Georges Galichet*6 met en place un émetteur en face d'un récepteur et un message entre les deux. Deux processus, l'élaboration du message (pas itérative ni récursive, chez lui, heureusement), un choix sur les deux «dimensions»*7 de la langue, et une lecture, où s'effectue un nouveau choix, parmi les valeurs sémantiques.

Même si on décide de remettre à plus tard la question de l'infinie récursivité des interprétations de l'automate humain, la question de la production n'est pas aussi simplement réglée. Même en faisant abstraction de la composante sémantique nécessaire à ce point-là du modèle.

Si la machine peut produire des mots qu'elle ne connaît pas, il n'en va pas de même pour le sujet parlant. La GG se contente de «faire des phrases», mais le modèle n'est ni efficace ni complet s'il ne permet pas d'engendrer des suites phoniques ou graphiques ou encore des suites de morphèmes.

Admettons que l'automate dispose des règles de formation des unités lexicales, tout le monde sait bien que toutes les combinaisons possibles ne sont pas exploitées. Ensuite, si l'automate est capable d'ajouter un mot à l'autre en vertu des règles qu'il possède, comment gère-t-il les contraintes contextuelles (restrictions sélectionnelles), introduites plus tard par Chomsky?

S'il ne s'agit que de produire des suites de symboles, bravo, mais la langue n'est pas un langage au sens des mathématiques. Inutile d'ailleurs de pousser si loin l'investigation.

Aucun*8 sujet parlant ne peut produire de phrases comportant des mots ou des morphèmes qu'il ne connaît pas. Les ratés et les productions bancales ne comptent pas comme phrases jamais prononcées. On peut envisager de calculer le nombre de phrases prononçables à partir d'un vocabulaire donné, mais sans contraintes sur les combinaisons les résultats sont effarants. À titre d'exemple, 12 objets peuvent se permuter de 479 001 600 manières.*9

Aucun sujet parlant normal ne peut produire de phrases qu'il ne comprend pas. Si mes souvenirs sont bons, un certain Oller*10 s'était donné la peine de chercher des limites à l'infinité ou -tude inscrite dans la doctrine générative. Personnellement, je me contenterai de substituer indéterminé à infini.

L'automate ne comprenant pas, peut, lui, continuer à aligner les symboles ne voulant rien dire. Mais en réalité, pour remplir son contrat et ne pas se trouver au rebut, il lui suffit d'imprimer (admettons, par réalisme), un nombre p de phrases + 1.


À suivre.

*1 Où j’ai fait preuve, sans le vouloir, d’une certaine créativité, inventant une solution, faute d’avoir étudié.
*2 Ce sont : la tyrannie du monde extérieur (Henri Poincaré et non Bachelard, comme je l'ai signalé précédemment), sur la pensée totalitaire, sur la Contradiction de Pradines : la preuve par la morphologie, selon qui les choses ne peuvent pas se contredire et sur la pseudo-créativité des locuteurs qui restent, malgré l'épistémologie, des sujets, bien que parlants, et même souvent bavards. Il y aura une suite où je me concentrerai sur la compréhension du jamais lu ou entendu.
*3 Dubois, Jean et al. 1974. Dictionnaire de Linguistique. Paris: Larousse. [Mathée Giacomo, Louis Guespin, Christiane Marcellesi et Jean-Pierre Mével]
*4 Dans le dictionnaire «Le langage» dirigé par Bernard Pottier*, on trouve un article de Jean-Pierre Desclés, «Linguistique et formalisation», qui traite des grammaires formelles de Chomsky.
*Pottier, B. (dir.). 1973. Le langage. Paris: CEPL.
*5 Naturellement, le sujet Robert Petit, en 2007, n'a pas gardé la trace de cette interprétation populaire. Mais le Larousse du XXe siècle et le Petit Larousse de 1918 parlent d'un savant ou de celui qui fait une étude spéciale des langues.
*6 Galichet, Georges. 1949. Physiologie de la langue française. Paris: PUF [1967].
*7 En «profondeur» et en «étendue»: on a reconnu les axes chers à Saussure et singulièrement pratiques: le paradigmatique (substitution/commutation) et le syntagmatique (combinaison/expansion).
*8 C'est à contre-gré (tiens, de la créativité!) que j'utilise le quantificateur universel contraire.
*9 Exemple de G. Boucheny et A. Guérinet dans la section arithmétique du GML, vol. 2:44. Repris par le PR. Mais ce n'est pas ainsi que fonctionne la langue. Un sujet parlant au sens strict (qui n'écrit pas par métier) a un vocabulaire inférieur à dix mille mots (estimation généreuse) et ne construit pas de phrase dépassant 20 mots, à moins de coordination ou de subordination. À 20, l'apposition est comprise (ex. ce matin à cinq heures). Et rares sont les sujets et les compléments qui peuvent permuter en conservant le même verbe, etc. Je laisse ces rares plaisirs aux linguistes-statisticiens. Combien de phrases de 20 mots peut-on construire avec 10 000 mots, sans répétition? On pourrait fixer la limite au chiffre que donnent les mêmes auteurs (du GML) pour les combinaisons des 27 lettres de l'alphabet, qui dépasse le doublement du rang du milliard: la dizaine au-dessus de 8 x 000 (15 octillion [?]).
*10 Oller, John, Jr. 1971. Coding Information in Natural Languages. La Haye: Mouton.

Libellés : , , , , ,