Rechercher

sur ce site


Accueil du site > Résumés des séminaires > Labo > Modèles phylogénétiques de la diversification des langues

Modèles phylogénétiques de la diversification des langues

La diversification des langues est un processus aléatoire semblable en bien des points à l’évolution biologique. On modélisera la diversification des données lexicales, et plus spécifiquement du vocabulaire dit ``de base’’, par un processus stochastique sur un arbre phylogénétique. On se concentra sur la famille des langues Indo-Européennes. L’âge du dernier ancêtre commun de ces langues est sujet à controverse et les problèmes de datation de langues anciennes sont donc particulièrement intéressants. On estimera la topologie de l’arbre phylogénétique, l’âge des langues ancestrales et les paramètres du modèle à l’aide de méthodes MCMC. Le modèle présenté incorpore plusieurs aspects spécifiques à la diversification des langues, tels l’hétérogénéité des taux de diversification ou le processus d’observation des données, et on montrera que les phénomènes d’emprunt de mots ne biaisent pas nos résultats. Enfin, on analysera deux jeux de données afin d’estimer l’âge du Proto-Indo-Européen.

CMAP UMR 7641 École Polytechnique CNRS, Route de Saclay, 91128 Palaiseau Cedex France, Tél: +33 1 69 33 46 23 Fax: +33 1 69 33 46 46