Contenu du sommaire : Mathématisation du langage au 20e siècle

Revue Histoire, Epistémologie, Langage Mir@bel
Numéro vol.31, n°1, 2009
Titre du numéro Mathématisation du langage au 20e siècle
Texte intégral en ligne Accessible sur l'internet
  • Mathématisation du langage au 20e siècle

    • Articles
      • Présentation - Jacqueline Léon, Philippe de Brabanter, Jean-Michel Fortis p. 5-17 accès libre
      • Mathématisation de la linguistique et nature du langage - Sylvain Auroux p. 19-59 accès libre avec résumé avec résumé en anglais
        La linguistique est sans doute l'une des rares disciplines à posséder une «mathématisation spécifique » . Elle le doit principalement à la nature même du langage et à des propriétés comme les possibilités de transposition, de substitution ou d'autonymie, ainsi qu'à la compositionnalité des éléments de l'énoncé. Dès l'apparition de la logique on voit naître une formalisation spécifique sous forme de littérarisation. Parmi les différentes formes de mathématisation possibles, la voie quantitative n'a, jusqu'ici, guère été féconde. La voie sémantique a longtemps été la plus fructueuse puisqu'on lui doit partiellement la naissance de nouveaux objets mathématiques (notions d'extension des concepts, à l'origine de celle de classe). Le succès de la mathématisation (et l'apparition de concepts intrinsèques) a tenu à l'extension de la notion de calcul. Elle passe massivement par la logique. Une première extension est venue avec l'algèbre de Boole. La seconde provient de la constitution de la notion moderne de calculabilité, liée aux machines de Turing et la théorie des langages formels ; elles ont fait naître une linguistique mathématique, qui s'est définitivement imposée dans la seconde moitié du 20e s.
        Linguistics is probably one of the few disciplines with its own specific mathematisation. This it owes mainly to the very nature of language and to properties like transposability, substitutability, autonymy, and compositionality. From the very early days of logic, there appeared a special formalisation, in the shape of an ideography. Among the various possible types of mathematisation, quantitative methods have not so far proved very productive. For a long time, semantic methods were the most fruitful ; notably, they were instrumental in the creation of new mathematical objects (e. g. the extension of a concept, which led to the notion of classes). In the end, the mathematisation of linguistics has been successful (and has forged intrinsic concepts) because it has broadened the notion of calculus. This development owes a lot to logic. An initial extension of calculus came with Boolean algebra. A second one stemmed from the modern notion of calculability, linked to Turing machines and the theory of formal languages : they gave birth to a genuine form of mathematical linguistics, which became dominant in the second half of the 20th century.
      • Les lois de Pareto et Lévy, leur cas particulier : la loi rang-fréquence de G.K. Zipf - Marc Barbut p. 61-74 accès libre avec résumé avec résumé en anglais
        Une famille de lois statistiques, dont la première fut découverte en 1896 par Vilfredo Pareto à propos de la distribution des revenus, est aussi universelle et générale que la «loi normale » : ce sont les lois en «fonction puissance » . On les trouve en effet dans des domaines aussi variés que la géographie urbaine, la répartition des richesses et des revenus (en économie), la géographie physique, la granulométrie, les mathématiques financières, etc. et la lexicologie, où elles sont connues sous les noms de lois de Zipf et d'Estoup ou encore — dans leur forme la plus générale — de B. Mandelbrot. Ce qui les caractérise, c'est que les très grandes valeurs n'y sont pas rares ; il en résulte qu'elles n'ont en général pas de variance et parfois pas de moyenne : ce dernier cas est fréquent en lexicologie. Par conséquent leur maniement nécessite quelques précautions, de même que l'interprétation des ajustements à des données empiriques. De l'universalité de ces lois résulte une grande variété des «modèles mathématiques » permettant de les engendrer. Ceux-ci vont de mécanismes totalement déterministes à des théories purement probabilistes : les lois stables de Paul Lévy.
        A family of statistical laws, the first of which was discovered in 1896 by Vilfredo Pareto in relation to the distribution of incomes, is as universal and as general as the “ normal law” : these are the laws expressed by “ power functions”. They are relevant in various domains such as urban Geography, the distribution of wealth and incomes (in Economics), physical Geography, Granulometry, Financial Mathematics, and Lexicology, where they are known as the Zipf and Estoup laws, or — in their most general form — as the Mandelbrot law. They are characterized by the fact that very large values of the variable are not unlikely ; hence, in general, the variance of a distribution is infinite, and possibly also its mean : the last case is frequent in Lexicology. Therefore they must be handled with care, notably when interpreting their application to empirical data. Due to the universality of these laws, there exists a great number of “ mathematical models” that can explain them. These range from absolutely deterministic mechanisms to pure probabilistic theories : Paul Lévy stable laws.
      • Le concept d'opérateur en linguistique - Jean-Pierre Desclés p. 75-98 accès libre avec résumé avec résumé en anglais
        La notion d'opérateur n'a pas toujours un statut bien clair en linguistique. Pourtant, l'application d'un opérateur à un opérande sert de base primitive aux formalismes applicatifs (λ-calcul, logique combinatoire, programmation fonctionnelle) utilisés explicitement ou implicitement par plusieurs linguistes. Considéré comme un processus opératoire, l'opérateur est associé à des unités linguistiques incomplètes (ou syncatégorèmes). Les types fonctionnels de Church formalisent adéquatement les différents types d'opérateurs des Grammaires Catégorielles. Les unités linguistiques étant des opérateurs, elles sont composables par les combinateurs de la logique combinatoire de Curry. En établissant un lien entre l'application et l'implication entre propositions, la correspondance, dite de Curry-Howard, entre le langage des types fonctionnels et celui des propositions, est interprétée dans le domaine de la linguistique.
        Linguists do not always use the term “ operator” clearly. Still, applying an operator to an operand is a basic operation in some applicative formalisms (λ-calculus, combinatory logics, functional programming) used by linguists. An operator is associated to syncategorematic linguistic expressions. Church's functional types are a suitable formalization of different types of operators in Categorial Grammars. Since linguistic units are viewed as operators, they can be composed by means of the combinators of Curry's Combinatory Logic. A formal link between application and implication in propositional calculus explains the relevance of the Curry-Howard correspondence between functional types and the implication in propositional calculus ; this correspondence is evaluated in the field of linguistics.
      • La rivalité historique entre une modélisation statique et dynamique des faits linguistiques - Wolfgang Wildgen p. 99-126 accès libre avec résumé avec résumé en anglais
        Le structuralisme linguistique et plus tard les modèles de Chomsky ont favorisé une modélisation surtout logiciste et par le fait même statique. Un résumé critique de cette approche ouvre le débat. À la suite de propositions faites par le mathématicien René Thom, un petit nombre de linguistes et sémioticiens ont élaboré une stratégie nouvelle pour la recherche des principes de la morphogenèse et de l'évolution des structures linguistiques. Pour faciliter une comparaison de la stratégie statique (logique, ensembliste) et de la stratégie dynamique (catastrophiste, synergétique) quelques résultats de la modélisation dynamique sont résumés : la morphogenèse d'un système de voyelles, les configurations d'attracteurs dans le noeud verbal de la phrase (l'actance) et les schémas de force dans la promesse. Au-delà d'une grammaire catastrophiste, la modélisation de l'énonciation fait apparaître une dynamique de coordination. Enfin, la composition sémantique demande un contrôle du chaos au sein des groupes neuronaux en interaction (synchronie). Cette comparaison méthodologique mène à une réflexion sur la relation entre mathématique et linguistique en mettant en relief trois façons de voir cette relation. En conclusion la «controverse des catastrophes » des années 1978, les réactions de Zeeman et Thom et les conséquences pour une méthodologie de la linguistique dynamique sont discutées.
        Linguistic structuralism and later generative grammars were mainly concerned with static (logic-or algebra-based) models. A critical overview of theses developments is given in the first section. Starting from proposals made by René Thom, a small group of linguists and semioticians developed a new strategy to search for morphogenetic principles and mechanisms of self-organization in language. In order to allow a methodological comparison of static (logical, set-theoretical) with dynamical (catastrophist) models, major achievements of dynamical models are summarized : the morphogenesis of vowel systems, configurations of attractors in verbal semantics (valence) and force schemata in a speech act (promise). Beyond a dynamical grammar (based on catastrophe theory), discourse and verbal interactions lead to the question of coordination and its stability. Finally the basic problem of neurodynamic synchrony in compositional semantics asks for chaos control. Our methodological comparison of both strategies leads to a reflection on fundamental relations between mathematics and linguistics. Three different perspectives are distinguished. By way of conclusion, the 1978 “ controversy on catastrophes” and its consequences (drawn differently by Thom and Zeeman) highlight aspects of this relation.
      • Mathematics of language learning - Edward P. Stabler p. 127-145 accès libre avec résumé avec résumé en anglais
        Le présent article passe en revue plusieurs approches mathématiques importantes de l'apprentissage des langues/ langages. Nous mettons en lumière certains postulats fondamentaux communs, notamment le fait que toutes ces approches admettent des restrictions sur les facteurs capables d'influencer l'apprentissage. On notera qu'une part importante des travaux actuellement en cours dans ce domaine est précisément consacrée à la découverte et la justification de ces restrictions.
        This paper surveys prominent mathematical approaches to language learning, with an emphasis on the common fundamental assumptions of various approaches. All approaches adopt some restrictive assumption about the nature of relevant causal influences, with much ongoing work directed to the problem of discovery and justification of these assumptions.
      • Linguistiques de corpus et mathématiques du continu - Stéphanie Girault, Bernard Victorri p. 147-170 accès libre avec résumé avec résumé en anglais
        Les nouvelles technologies ont transformé radicalement les rapports des linguistes avec leur objet d'étude. On peut disposer aujourd'hui très facilement d'une impressionnante masse de données sur la langue, qui couvre la plupart de ses usages (du moins dans le domaine de l'écrit), sans aucune commune mesure avec ce qui était accessible il y a à peine dix ans. De plus, on commence à disposer de ressources linguistiques (comme les dictionnaires électroniques) de plus en plus exhaustives, et d'outils de traitement (analyseurs syntaxiques, etc.) de plus en plus fiables. Cet ensemble représente en fait un nouvel «instrument » qui permet de «voir » les phénomènes langagiers comme on n'avait jamais pu le faire auparavant, un peu comme la lunette de Galilée a permis de voir des phénomènes astronomiques (les ombres sur la Lune, les satellites de Jupiter, etc.) inaccessibles jusqu'alors. Il est donc assez normal que ce nouveau dispositif d'observation transforme assez radicalement les méthodes et les attendus de la modélisation informatique en linguistique et de ses applications en traitement automatique des langues.
        New technologies have markedly changed the way linguists relate to their object of study. An impressive amount of data about language is now available, covering most of its usages – at least in the written medium – immeasurably more than what was on hand merely a decade ago. Moreover, linguistic resources are getting more comprehensive than ever (e. g. electronic dictionaries), while the reliability of processing tools keeps increasing (e. g. syntactic parsers). Together they constitute a new tool for scrutinizing the phenomena of language in ways that were not conceivable before, a bit like Galileo's telescope suddenly revealed astronomic phenomena that could not have been perceived without it. Unsurprisingly, such an observation tool is having a profound impact upon both the methods and expectations of computer‑modeled linguistics and its applications to automated language processing.
    • Varia
      • Un homme nommé 'Af‛al : Sībawayhi et les incertitudes du métalangage - Jean-Patrick Guillaume p. 171-187 accès libre avec résumé avec résumé en anglais
        Les ‘ mots-modèles' (mitāl, pluriel amtila), mots fictifs destinés à représenter le schème morphologique des mots réels, constituent l'un des premiers outils élaborés par la tradition grammaticale arabe, et un élément important de son métalangage. Leur statut et leur usage font l'objet d'un chapitre du Kitāb de Sībawayhi (mort en 797), qui se présente comme une discussion entre celui-ci et son maître al-Xalīl (mort en 791) ; cette discussion est toutefois loin d'être claire, et mêle constamment trois lignes d'argumentation distinctes et difficilement compatibles. Ces incertitudes sont dues, en dernière analyse, à la tension, perceptible dans l'ensemble des textes grammaticaux arabes, entre une attitude intégrationniste stricte (les mots-modèles sont des mots comme les autres, et il convient de leur appliquer les règles de l'usage commun) et le souci de préserver leur fonction d'outils métalinguistiques.
        The ‘ pattern-words' (mitāl, plural amtila), i. e. fictive words designed to represent the morphological patterns of real words, are among the first tools created by the Arabic grammatical tradition, and form an important element of its metalanguage. Sībawayhi (d. 797) devotes a chapter of the Kitāb to their status and their use, in the form of a discussion between himself and his master al-Xalīl ; this discussion, however, if far from being conclusive, as it constantly mixes between three different – and to a point mutually exclusive – lines of argumentation. These uncertainties are due, all things considered, to the tension which pervades all Arabic grammatical texts, between a strictly integrationist attitude (pattern-words are words like the others, and should be treated as such), and the preoccupation with preserving their function as metalinguistic tools.
    • Lectures et critiques