Aris Xanthos

Axes de recherche | Collaborations |

Axes de recherche

Analyse de corpus d'acquisition

Encodage et analyse de corpus d'acquisition du français (dans le cadre du Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition, dirigé par le Prof. Wolfgang Dressler de l'Académie Autrichienne des Sciences (ÖAW) et impliquant une quarantaine de chercheurs en Europe et ailleurs). Participation à plusieurs projets dans ce cadre (notamment sur l'acquisition de l'adjectif et les phénomènes de "fine-tuning"). Développement d'une méthode visant à quantifier la diversité des formes flexionnelles présentes dans des corpus, d'une façon qui se prête à une comparaison translinguistique et neutralise, dans la mesure du possible, les effets de taille de l'échantillon (Xanthos et Laaha, 2007; Xanthos et Gillis, à paraître; Xanthos et al., à paraître).

Extraction automatique de connaissances linguistiques

Développement de méthodes pour l'extraction automatique de connaissances linguistiques, en particulier sur la base du principe de la longueur de description minimale (minimum description length, MDL). Analyse morphologique non-supervisée des langues du type "introflexionnel" comme l'arabe ou l'hébreu (Xanthos, 2008). Analyse phonologique non-supervisée (algorithme de Sukhotin, classification spectrale, HMM), cf. Goldsmith et Xanthos (2009).

Segmentation textuelle

Méthodes de segmentation (non-supervisée) du texte en mots, dans une perspective de modélisation de l'acquisition (Xanthos, 2004a, 2004b) et d'analyse des données textuelles (Bavaud et Xanthos, 2002). Développement d'une nouvelle méthode d'identification automatique des séparateurs basée sur le principe du MDL (Xanthos et Bavaud, soumis pour publication).

Interactivité et modularité en analyse des données textuelles

Réflexion sur les conditions d'une réelle interactivité et modularité dans le génie logiciel appliquée à l'analyse des données textuelles (ADT) - dans la perspective de rendre ces méthodes aussi accessibles que possible aux chercheurs de Lettres et sciences humaines et de favoriser ainsi l'innovation dans ce domaine. Développement d'une plateforme logicielle interactive et modulaire pour l'ADT multilingue

Partagez:
Unicentre - CH-1015 Lausanne
Suisse
Tél. +41 21 692 11 11
Swiss University