L évolution des langages indo-européen



Documents pareils
Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

MABioVis. Bio-informatique et la

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

Ebauche Rapport finale

Raisonnement probabiliste

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

LE PROBLEME DU PLUS COURT CHEMIN

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

Analyse dialectométrique des parlers berbères de Kabylie

Algorithmes d'apprentissage

Cours de Master Recherche

La Gestion de fichiers Supports réalisés avec OpenOffice.org 2.3 Writer. La Gestion de fichiers. Niveau : Débutant Auteur : Antonio da Silva

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Qu est-ce qu un emprunt linguistique?

Les structures de données. Rajae El Ouazzani

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Algorithmes de recherche

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

C f tracée ci- contre est la représentation graphique d une

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Chaînes de Markov au lycée

Introduction à MATLAB R

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

Pourquoi l apprentissage?

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

L apprentissage automatique

OPTIMISATION À UNE VARIABLE

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

données en connaissance et en actions?

MCMC et approximations en champ moyen pour les modèles de Markov

PROGRAMMES D INFORMATIQUE

Table des matières. I Mise à niveau 11. Préface

Développement d'un projet informatique

2 Moodle Guide 2c : banque de questions et activité Test. Version du service

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Texte Agrégation limitée par diffusion interne

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

MASTER 2 IMAFA. Informatique et Mathématiques Appliquées à la Finance et à l'assurance

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

BACHELIER EN INFORMATIQUE DE GESTION

Agrégation des portefeuilles de contrats d assurance vie

Baccalauréat ES Amérique du Nord 4 juin 2008

Résumé des communications des Intervenants

ENSEIGNEMENT ASSISTÉ PAR ORDINATEUR ET E.A.O. ET LANGUES ÉTRANGÈRES À L'UNIVERSITÉ

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

FaceBook aime les Maths!

chapitre 4 Nombres de Catalan

Calcul de développements de Puiseux et application au calcul du groupe de monodromie d'une courbe algébrique plane

Gènes Diffusion - EPIC 2010

Grammaires d unification

Présentation du module Base de données spatio-temporelles

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

Correction du baccalauréat ES/L Métropole 20 juin 2014

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

FIMA, 7 juillet 2005

Communiqué de Lancement

Programmation des Applications Réparties. Parsers XML DOM et SAX

Disciplines. Ecoles - facultés - titres délivrés. UNIL - Faculté des lettres. Maîtrise universitaire ès Lettres

Construction et maintenance d une ressource lexicale basées sur l usage

Informatique et sciences du numérique

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : hivert

Cours de Licence 2 - ICL 2A 01 c : Notions de base en sciences de l'information et de la communication adaptées au contexte interculturel

Systèmes d information et bases de données (niveau 1)

Numéro de dossier : 001. Caisse d Epargne Côte d Azur

École de maturité. Répartition horaire des disciplines, plan d études et liste des examens écrits et oraux pour l année scolaire

I/ CONSEILS PRATIQUES

6 1 ERE PARTIE : LES PRINCIPES DE BASE DE DNS

TRACER LE GRAPHE D'UNE FONCTION

Les risques liés à l activité de l entreprise : quels outils pour les identifier?

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Etudier l informatique

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

LICENCE : INFORMATIQUE GENERALE

Bernard HAMM, Évelyne LAVOISIER

Définitions. Numéro à préciser. (Durée : )

Territoire3D. Descriptif de contenu. Institut Géographique National. Date du Document : Mars 2011

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

ANNEXE 1 DEFINITIONS DES NIVEAUX DE QUALIFICATION DES EMPLOIS

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

ECTS CM TD TP. 1er semestre (S3)

La Certification de la Sécurité des Automatismes de METEOR

Compression de Données - Algorithme de Huffman Document de Conception

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique

Préparation d une maturité avec mention bilingue français-allemand ou français-anglais

«La pomme qui voulait voyager»

Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server

FILIERE CULTURELLE. Adjoint territorial du patrimoine de 1 ère classe

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

Formation Ouverte et A Distance

Transcription:

L évolution des langages indo-européen Département d informatique Antoine CAYPHAS, James TRIPODI, Kevin DEBRY et François TROESSAERT Nos Buts : - Déterminer - Observer L'évolution des langages Comment représenter l'évolution de ces langages? - Un ARBRE Comment construire un arbre de ce type? Allemand Néerlandais Français Pourquoi l'informatique peut-il être utile? Anglais Quelle donnée? pagnol - Lexical Quelle méthode? - Les méthodes de distance Image provenant de : http://maykan.wordpress.com/2011/03/18/chronique-de-quebec-par-jean-marc-ouellet-4/

L évolution des langages indo-européen Département d informatique Antoine CAYPHAS, James TRIPODI, Kevin DEBRY et François TROESSAERT Distance de Levenshtein Langue Français / Fr Mots Champ Calcul du nombre minimum de : - Insertion / Délétion - Substitution Champ Veld Field Feld Campo Champ 0 5 5 5 2 Néerlandais / Veld Anglais / En Field C h a m p - C a m p o 2 Insertions / Délétions 0 Substitution Distance = 2 + 0 = 2 Veld 5 0 2 1 5 Field 5 2 0 1 5 Allemand / De Feld Feld 5 1 1 0 5 pagnol / Campo V - e l d F i e l d 1 Insertion / Délétion 1 Substitution Distance = 1 + 1 = 2 Campo 2 5 5 5 0 Algorithme UPGMA Matrice de Distance Arbre Calcul de la nouvelle distance Fr En De Dist(De/, En) = (70+72) / 2 = 71 Cycle 1 Fr - 82 82 83 58 82-70 45 84 De/ De Dist(De/, Fr) = (82+83) / 2 = 83 En 82 70-72 84 Dist(De/, ) = (84+84) / 2 = 84 De 83 45 72-84 58 84 84 84 - Fr En De/ Cycle 2 Fr - 82 83 58 En 82-71 84 Fr/ Fr Dist(Fr/, En) = (82+84) / 2 = 83 Dist(Fr/, De/) = (83+84) / 2 = 84 De/ 83 71-84 58 84 84 - Fr/ En De/ De Cycle 3 Fr/ - 82 83 De/ Dist(De//En, Fr/) = (82+83) / 2 = 83 En 82-71 De/ 83 71 - De/ /En En De/ De De/ /En Fr/ De//En En Cycle 4 Fr/ - 83 Racine De//En 83 - Fr/ Fr

Évolution des langues indo-européennes Département d'informatique Antoine CALEGARO, Yehudi HOLLEVOET, Antoine LIGOT, Jean LOBET et Michaël STEVENS L'indo-européen Langue préhistorique, sans trace écrite, supposée être à l'origine de toutes les langues dites indo-européennes. La linguistique Discipline s'intéressant à l'étude des langues qui sont modélisées à l'aide de trois classes de caractères : Les caractères morphologiques : les règles grammaticales Les caractères phonologiques : la structure des sons Les caractères lexicaux : la signification des mots Objectif Déterminer l'histoire évolutive d'un ensemble de langues et exprimer cette connaissance au travers d'arbres phylogénétiques Arbre phylogénétique Présence du subjonctif Le son /f/ peut s'orthographier [ph] Présence d'un pronom de politesse Montre les relations de parenté entre des groupes de langues. Langue A Langue B Chaque noeud interne représente Langue C l'ancêtre commun de ses deux descendants. Récupération des données Affichage du résultat Traitement des données Exploitation des résultats Dans le domaine de l'histoire, l'étymologie,... Déduire un modèle sur l'évolution des langues. Comment une langue évolue-t-elle? L'étrusque? Le méroïtique?

Évolution des langues indo-européennes Département d'informatique Antoine CALEGARO, Yehudi HOLLEVOET, Antoine LIGOT, Jean LOBET et Michaël STEVENS Les différentes méthodes de reconstruction d'arbres phylogénétiques Les méthodes exactes Langages Arbres 5 105 Recherche exhaustive 6 945 7 10 395 Énumère toutes les constructions possibles pour ensuite déterminer la solution optimale. 8 135 135 9 2 027 025 10 34 459 425 20 8.2 x 10 21 Les méthodes par rapprochement 30 2.75 x 10 76 Méthodes agglomératives Fonctionnent par itérations successives. À chaque itération, les deux langues les plus proches sont assemblées. Au final, nous obtenons un arbre phylogénétique. Méthodes heuristiques Permettent de trouver une solution approchant la solution exacte à l'aide de processus aléatoires. Il s'agit d'un compromis entre la rapidité de recherche et la qualité des solutions trouvées. Réarrangement des branches Modification aléatoire qui implique un changement de la structure de l'arbre. Le but étant d'analyser un ensemble d'arbres voisins. McMc Monte Carlo et Chaine de Markov Méthode heuristique permettant de déduire la probabilité que la structure d'un arbre soit optimale, connaissant la probabilité que deux langues soient associées.

Des arbres phylogénétiques linguistiques Sciences Informatiques Nicolas CAMBIER, Hadrien GOFFIN, Hassan AMOUHZI, Gabriel SHAKO EKANGA L'origine des langues Indo-européens On note entre les langages européens et d'autres très lointains (comme le sanskrit) de nombreuses ressemblances. Un indice vers l'origine de ces Bioinformatique Pour établir le lien entre ces différentes langues, les linguistes se sont tournés vers les techniques utilisées en biologie pour comparer des séquences d'adn. peuples? Elfique?! L'étude linguistique s'applique à toutes les langues. Pourquoi pas les langues fictives? Mettons J.R.R Tolkien à l'épreuve... Français Latin Protogermanique Sanskrit Grec ancien Vache Bos Kowz Go Boús Cuivre Aes Aiz Ayas Kansya Or Aurum Gulba SvarNa Agkhouros Anglais Elvish?! Un anneau pour les gouverner tous One ring to rule them all

Des arbres phylogénétiques linguistiques Sciences Informatiques Nicolas CAMBIER, Hadrien GOFFIN, Hassan AMOUHZI, Gabriel SHAKO EKANGA Comment construire un arbre phylogénétique? Tester la cohérence de Tolkien! Comme le quenya et le telerin d'aman, le sindarin descend de l'eldarin commun, la langue des Eldar pendant leur grande marche de Cuiviénen vers le Valinor, lui-même dérivé du quendien. «Et ils se nommèrent les Quendi, signifiant ceux qui parlent avec des voix, car ils n avaient pas encore rencontré d autres êtres vivants qui parlassent ou chantassent.» Morgoth s Ring Partie II «Les Annales d Aman» On crée tous les arbres possibles et on prend celui qui a le coût le plus bas :