Contenu du sommaire : Mathématiques et phonologie

Revue	Mathématiques et sciences humaines
Numéro	no 180, hiver 2007
Titre du numéro	Mathématiques et phonologie
Texte intégral en ligne	Accessible sur l'internet

Introduction au n° spécial « Mathématiques et phonologie » - Gabriel Bergounioux, Maïtine Bergounioux, Noël Nguyen, Sophie Wauquier p. 1-7
Quel programme de recherche en mathématique et phonologie ? - Gabriel Bergounioux, Maïtine Bergounioux, Noël Nguyen, Sophie Wauquier p. 9-26
Nous proposons un état des lieux, à la fois dans les interrogations actuelles que soulève la rencontre des deux disciplines et dans l'histoire de leurs relations, depuis les propositions fondatrices de Troubetzkoy jusqu'à aujourd'hui. Il se conclut par une réflexion sur le défi que constitue pour la mathématique la confrontation à un objet qui lui est peu familier et sur les clivages qui mettent à l'épreuve les capacités d'analyse et de modélisation (langage vs. langues, forme mentale vs. forme symbolique, signal vs. écriture galiléenne).
We provide a discussion of the state of the art of current inquiries both in Linguistics and in Mathematics and describe the relation that has existed between these disciplines since Troubetzkoy's proposal. In particular, we emphasize the challenge it has been for Mathematics to include Phonology as one of its objects.
From features to contours. Why forms, not accoustic signals, should be modelled - Joaquim Brandão de Carvalho p. 27-41
L'objet de toute modélisation mathématique en phonologie doit consister en des catégories formelles discrètes, non en des paramètres phonétiques. Telle est la thèse soutenue ici, qui s'oppose aux courants inductifs en vogue actuellement. L'existence de « patrons temporels » mise en avant par ces approches ne constitue pas, en tout cas, un argument recevable à l'encontre d'une phonologie formelle : on montrera ici que l'hypothèse de « contours » temporels est nécessaire dans la théorie phonologique. En vérité, la plupart des soi-disant traits phonologiques gagneraient à être définis comme des propriétés émergentes de tels contours, ce qui implique de fonder mathématiquement des notions phonologiques telles que l'« association autosegmentale ». Au total, moins les concepts de la théorie phonologique apparaissent comme des métaphores, plus le contenu de ses primitives paraît abstrait.
It is argued here that the object of mathematical modelling in phonology should consist of discrete formal categories, not of phonetic parameters, contrary to the claims of current empiricist approaches to phonological knowledge. In any case, the existence of “temporal patterns”, emphasized by these approaches, is not an acceptable argument against formal phonology: temporal “contours” are shown to be necessary objects in phonological theory. Indeed, most so-called phonological features should be viewed as emerging from such contours. To what extent this is the case depends on whether phonological notions like “autosegmental association” could actually be mathematically grounded. As a result, the less metaphorical the concepts of phonological theory are, the more abstract the content of its primitives is.
A stochastic model for the speech sonority - Marzio Cassandro, Pierre Collet, Denise Duarte, Antonio Galves, Jesus Garcia p. 43-55
Nous étudions des familles de chaînes quantifiées à valeurs réelles. Ces chaînes sont liées par une hypothèse d'existence d'une partition universelle de leur image, telle que la loi de chaque chaîne conditionnée par l'appartenance à un de ses éléments est indépendante de la chaîne. Nous introduisons une nouvelle classe d'estimateurs des points de séparation définissant la partition et démontrons la consistance de ces estimateurs. Nous pouvons alors utiliser ces résultats pour modéliser l'évolution de la sonorité des langues naturelles, sur la base d'un corpus linguistique de 1667 propositions en huit langues différentes. Nous montrons qu'un modèle avec quatre points universaux de séparation décrit bien les données. La notion nouvelle de famille de chaînes quantifiées liées pourrait s'appliquer à d'autres situations dans lesquelles différents agents stochastiques s'expriment par l'intermédiaire du même genre d'interface.
We study families of bounded real valued tied quantized chains. The chains are tied together by the assumption that there is a universal partition of the range, such that the distribution of the chains, conditioned on each interval of the partition is independent of the chain. We define a new class of cross estimators for the cut-points separating these intervals and prove their asymptotic consistency. We apply our results to model the sonority time evolution of different languages using a linguistic corpus with 1667 sentences from eight different languages. We show that a model with four universal cut-points is in good agreement with the data. The new notion of family of tied quantized chains should be relevant for modeling other situations in which different stochastic agents express themselves using the same type of interface.
On segments and syllables in the sound structure of language: curve-based approaches to phonology and the auditory representation of speech - Olivier Crouzet p. 57-71
Les approches récentes de la syllabe réintroduisent une description continue et descriptible mathématiquement des objets sonores : les courbes. Les recherches psycholinguistiques sur la perception du langage parlé ont plutôt recours à des descriptions symboliques et hautement hiérarchisées de la syllabe dans le cadre desquelles segments (phones) et syllabes sont strictement différenciés. Des travaux récents sur les fondements auditifs de la perception de la parole mettent en évidence la capacité qu'ont les locuteurs à extraire une information phonétique alors même que des dégradations majeures du signal sont effectuées dans le domaine spectro-temporel. Les implications de ces observations pour la conception de la syllabe dans le champ de la perception de la parole et en phonologie sont discutées.
Recent approaches to the syllable reintroduce continuous and mathematical descriptions of sound objects designed as “curves”. Psycholinguistic research on oral language perception usually refer to symbolic and highly hierarchized approaches to the syllable which strongly differenciate segments (phones) and syllables. Recent work on the auditory bases of speech perception evidence the ability of listeners to extract phonetic information when strong degradations of the speech signal have been produced in the spectro-temporal domain. Implications of these observations for the modelling of syllables in the fields of speech perception and phonology are discussed.
Probability for linguists - John Goldsmith p. 73-98
Nous présentons une introduction à la théorie des probabilités pour les linguistes. À partir d'exemples choisis dans le domaine de la linguistique, nous avons pris le parti de nous focaliser sur trois points : la différence conceptuelle entre probabilité et fréquence, l'utilité d'une évaluation de type maximum de vraisemblance dans l'évaluation des analyses linguistiques, et la divergence de Kullback-Leibler.
This paper offers a gentle introduction to probability for linguists, assuming little or no background beyond what one learns in high school. The most important points that we emphasize are: the conceptual difference between probability and frequency, the use of maximizing probability of an Kullback-Leibler divergence.
Apprentissage « bottom-up » des phonèmes : une étude computationnelle - Rozenn Le Calvez, Sharon Peperkamp, Emmanuel Dupoux p. 99-111
Nous présentons une étude computationnelle de l'hypothèse selon laquelle l'information distributionnelle est suffisante pour acquérir les règles allophoniques (et ainsi les phonèmes) de façon bottom-up. L'hypothèse a été testée en utilisant une mesure de la théorie de l'information qui compare les distributions. La phase de test a été conduite sur plusieurs corpus de langues artificielles et sur deux corpus de langues naturelles (constitués de transcriptions de parole adressée aux enfants) typologiquement distantes : le français et le japonais. Trois filtres ont été ajoutés à la mesure. L'un concerne la fiabilité statistique due à la taille de l'échantillon, les deux autres prennent en compte les deux propriétés universelles des règles allophoniques suivantes : les éléments d'une règle allophonique doivent être phonétiquement proches, et les règles allophoniques doivent être de nature assimilatoire.
We present a computational evaluation of a hypothesis according to which distributional information is sufficient to acquire allophonic rules (and hence phonemes) in a bottom-up fashion. The hypothesis was tested using a measure based on information theory that compares distributions. The test was conducted on several artificial language corpora and on two natural corpora containing transcriptions of speech directed to infants from two typologically distant languages (French and Japanese). The measure was comple-mented with three filters, one concerning the statistical reliability due to sample size and two concerning the following universal properties of allophonic rules: constituents of an allophonic rule should be phonetically similar, and allophonic rules should be assimilatory in nature
On the probabilistic modelling of the form~function articulation for prosodic phenomena - Irina Nesterenko, Stéphane Rauzy, Daniel Hirst p. 113-126
Nous explorons l'application des méthodes hybrides, reposant à la fois sur des représentations symboliques (phonologiques) et probabilistes dans la modélisation de l'interface « forme ~ fonction » pour des phénomènes intonatifs. À partir d'une représentation symbolique ancrée dans l'acoustique du signal et en accord avec les principes de la phonologie intonative, deux modèles d'enchaînement des catégories tonales sont dérivées moyennant les méthodes de grammaires probabilistes. Deux modèles probabilistes sont testés : le modèle des bigrammes et le modèle des patrons ; leur performance est ensuite évaluée à l'aide de la mesure d'entropie. Ces modèles sont enfin testés en prédiction.
Hybrid techniques based both on symbolic (phonological) representations and probabilistic information are applied in modelling the form ~ function interface for the prosodic phenomena. The symbolic representation is acoustically oriented and agrees with the principles of intonational phonology. On the basis of this representation, two models of tonal segments sequences are calculated according to the paradigm of probabilistic grammars. We test both the bi-grams model and the patterns model: the models' performance is further evaluated with the entropy measure. Finally, the probabilistic models are tested in prediction.
Acoustic and phonological learning: two different dynamics? - Betty Tuller p. 127-139
Qu'est-ce qui détermine le succès ou l'échec lorsque des adultes essaient d'apprendre à percevoir des sons de parole qui ne figurent pas dans leur langue maternelle ? Dans ce travail, l'apprentissage phonologique est exploré dans un cadre théorique explicitement dynamique. Les catégories phonologiques sont conçues comme les attracteurs d'un système dynamique évoluant au fur et à mesure que l'apprentissage se déroule. Le système dynamique lui-même est structuré par le système phonologique maternel, tel que celui-ci s'est mis en place chez l'auditeur individuel. Cette approche devrait contribuer à intégrer la phonétique et la phonologie (descriptions continues et descriptions symboliques et discrètes) à l'intérieur d'un cadre théorique commun, qui devrait lui-même permettre de mieux comprendre comment les individus perçoivent des formes phonologiques nouvelles.
What determines success or failure when adults try to learn to hear speech sounds that are not in their native language? Here we use an explicitly dynamical framework for exploring phonological learning. Phonological categories are conceptualized as attractors in a dynamical system that evolves as learning proceeds. The dynamical system itself is structured by the native phonological system, as it is instantiated in the individual listener. This approach should help integrate phonetics and phonology (continuous and discrete symbolic descriptions) within a common frame-work, which in turn may elucidate how individuals perceive new phonological forms.