Partie rédactionnelle du rapport d activité. Nom patronymique : Linarès Prénom : Georges NUMEN : 02S9802895SPU

Documents pareils

Apprentissage Automatique

MODE D'EMPLOI. Merci de remplir ces rubriques pour le vendredi 23 Juillet dernier délai et SI POSSIBLE, pour le 16 Juillet

MASTER LPL : LANGUE ET INFORMATIQUE (P)

RÉSUMÉ DESCRIPTIF DE LA CERTIFICATION (FICHE RÉPERTOIRE)

UNIV. LA ROCHELLE (IUT) Référence GALAXIE : 4099

Master Théorie et pratiques des arts interactifs

Master Informatique Aix-Marseille Université

Rapport d évaluation du master

Projet de Master en Informatique: Web WriteIt!

UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises)

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

Rapport d'activité du groupe Langage Laboratoire Informatique d'avignon

MASTER RECHERCHE CINEMA : APPROCHES INTERCULTURELLES

Rapport d évaluation du master

Forge. Présentation ( )

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général

S LICENCE INFORMATIQUE Non Alt S Alt S S1 S2 S3 S4 SS5 S6 Parcours : S IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques)

Université d'avignon et des Pays de Vaucluse. Philippe Michelon

S LICENCE INFORMATIQUE Non Alt Alt SS1 S2 S3 S4 S5 S6 Parcours : IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques)

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

CURRICULUM VITAE. Informations Personnelles

Licence professionnelle Conception et administration de systèmes d information en réseau

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Cécile MAUNIER. Maître de Conférences Sciences de Gestion Responsable pédagogique - Master 1 Marketing, Vente TITRES UNIVERSITAIRES

Apport de l information temporelle des contextes pour la représentation vectorielle continue des mots

OUVERTURE DE VACANCE

Formations et diplômes. Rapport d'évaluation. Master Finance. Université Jean Monnet Saint-Etienne - UJM. Campagne d évaluation (Vague A)

COORDONNÉES PROFESSIONNELLES PARCOURS PROFESSIONNEL FORMATION

MASTER 2 IMAFA. Informatique et Mathématiques Appliquées à la Finance et à l'assurance

Notice biographique Repères biographiques communs. Grade : Maître de conférences depuis septembre Ecole Abbé Grégoire du CNAM.

Reconnaissance automatique de la parole à l aide de colonies de fourmis

Groupe Mathématiques Instrumentées au Lycée

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales

Rapport d évaluation des masters réservés aux établissements habilités à délivrer le titre d'ingénieur diplômé

Master Energie spécialité Energie électrique

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

L IDEX DE TOULOUSE EN BREF

MASTER RECHERCHE MEDIATIONS DES SCIENCES. Mention HISTOIRE, PHILOSOPHIE ET. Histoire et Philosophie des Sciences. Année 2007/2008

Contributions à la reconnaissance robuste de la parole

ANNEXE 1. Si vous souhaitez ajouter un descriptif plus détaillé de l offre à votre annonce, merci de le joindre accompagné de ce formulaire.

IMO - Informatique, modélisation et optimisation

Les métiers de la recherche

ANNEXES. Evaluation de la formation à Polytech Lille Département GIS. Enseignements les plus utiles. Enseignements à renforcer

Cyril HÉDOIN 12bis Grande Rue TINQUEUX 28 ans

Baccalauréat technologique

Master Information et communication spécialité Produits et services multimédia

DUT. Informatique, orientation Imagerie Numérique. Domaine : Sciences, Technologies, Santé. Mention : Informatique

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

Attachée Temporaire d Enseignement et de Recherche Institut d Administration des Entreprises Université de Toulouse 1 Capitole.

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Thales Services, des systèmes d information plus sûrs, plus intelligents

Quel est l apport de la détection d entités nommées pour l extraction d information en domaine restreint?

Licence professionnelle Systèmes d information, méthodes et outils

Licence Professionnelle Gestion de l'économie sociale et solidaire et Entrepreneuriat

GUIDE PRATIQUE DU REFERENCEMENT NATUREL

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

Pascal Forget 2310, Avenue Notre-Dame Québec, (Québec) Canada, G2E 3G5 Tél. (418) Fax (418)

MASTER INFORMATIQUE COLLABORATIVE EN ENTREPRISE (ICE)

Laboratoire 4 Développement d un système intelligent

Master 2 professionnel Soin, éthique et santé Mention Philosophie

UNIVERSITE DE BREST Référence GALAXIE : 4201

MASTER LLCE : ETUDES ROMANES - ENTREPRISES ET ÉCHANGES INTERNATIONAUX, AIRE IBÉRIQUE ET LATINO-AMÉRICAINE (P)

Objectifs de la formation

Ebauche Rapport finale

Licence professionnelle METINET : Concepteur et Gestionnaire de Sites Internet

Rapport de l AERES sur l unité :

RÉFÉRENCEMENT NATUREL GOOGLE. Kelreferencement, marque déposée de Kelsociété

RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS)

NAXIS - 50, rue Copernic PARIS SARL au capital de SIRET : APE : 8559 A Identifiant TVA : FR N

MASTER PROFESSIONNEL

Master Sciences et Technologies Mention Informatique Spécialité E-Services en Alternance

Etudier l informatique

Le Master Mathématiques et Applications

Résultats de l'appel à projets CréaMOOCs

Curriculum Vitae. Informations générales

n/ëw nouvelle ecole du web Programme partenaire

Les cotutelles internationales de thèse

MASTER. Comptabilité, Contrôle, Audit (CCA) Domaine : Droit, Economie, Gestion. Mention : Comptabilité-Finance

Bruno ASDOURIAN Lecteur en Sciences de la Communication et des Médias Université de Fribourg Suisse

Dafoe Présentation de la plate-forme UIMA

Cursus de Master en Ingénierie de la Production Alimentaire. Une autre façon d accéder au métier d ingénieur

Notice biographique Repères biographiques communs

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

Filière «Économie et Entreprise» 2015/2016

Rapport d évaluation du master

ISTEX, vers des services innovants d accès à la connaissance

Méthodologie de conception des Systèmes d Aide à l Exploitation des Simulateurs d Entraînement

SUPPLEMENT AU DIPLOME

Présentation Cette bi-licence combine les exigences et les objectifs des deux licences disciplinaires :

Université de Haute Alsace. Domaine. Sciences Humaines et Sociales. MASTER Mention Éducation, Formation, Communication UHA, ULP, Nancy 2

MASTER PRO IMAGE&MULTIMEDIA : CONCEPT, PRODUCT, MULTIMEDIA

Présentation de la majeure ISN. ESILV - 18 avril 2013

CREDA². CRéation d'entreprise et Développement d'activités ²

Fiche de poste : PAST Tourisme Culturel & Territoires. Publication du poste : 7 avril 2015

Bachelier Bibliothécaire- Documentaliste!

Transcription:

Partie rédactionnelle du rapport d activité Nom patronymique : Linarès Prénom : Georges NUMEN : 02S9802895SPU Table des matières 1Synthèse de la carrière...1 1.1.Etat civil...1 1.2.Cursus...1 1.3.Principales responsabilités...2 2Activité scientifique...2 2.1.Thématiques de recherche...2 2.2.Production scientifique...4 2.2.1Synthèse des publications...4 2.2.25 publications majeures...4 2.2.3Logiciels, campagnes d évaluation...5 2.3.Encadrement et animation de la recherche...6 2.3.1Direction, animation laboratoire et équipes de recherche...6 2.3.2Participation aux comités d'organisation de manifestations scientifiques...6 2.3.3Direction de thèse et autres travaux...7 2.4.Valorisation de la recherche...7 2.4.1Responsabilité de projets financés...8 2.4.2Participation à des projets financés...8 2.5.Rayonnement...9 3Présentation de l'activité d'enseignement...10 4Responsabilités Collectives...11 4.1.Présentation générale...11 4.2.Synthèse des responsabilités administratives...12 1 Synthèse de la carrière Thèse en 1998, Maître de Conférence en 1999, HDR en 2009, Professeur d'université en 2011 à l'uapv, codirecteur du CERI et directeur du LIA (EA 4128, 65 personnes) depuis 2010. 1.1. État civil Georges Linarès, né le 29 décembre 1968 à Orléans Nationalité Française, 2 enfants Adresse : 256 Route de l'isle sur la Sorgue 84510 Caumont sur Durance Tél : (+33/0) 4 90 84 35 20 E-mail : georges.linares@univ-avignon.fr Site Web 1.2. Cursus 2011 : Professeur des Universités, Université d Avignon et des Pays de Vaucluse, 2009 : Habilitation à diriger les recherches «Reconnaissance de la parole et indexation audio», soutenue le 4/12/2009. Jury : Bernard Mérialdo (Eurecom), Pierre Dumouchel (Univ. de Montréal), Régine André-Obretch (IRIT, Univ. Toulouse), Jean-François Bonastre (UAPV). 1

1999 : Maître de conférence à l'uapv, Laboratoire Informatique d'avignon (LIA). 1998/1999 : ATER au LIA, UAPV 1998 : Doctorat de l'uapv, soutenu le 17/02/1998, sur le sujet : «Détection de ruptures et classification automatique dans un environnement de bruits impulsifs», sous la direction de Henri Méloni et Pascal Nocéra. 1995 : DEA Mathématiques et Informatique, Université de Toulon et du Var, Mention Bien. Stage recherche au LIA sur le sujet : «Adaptation au locuteur par transformations neuromimétiques». Encadrement : Pascal Nocéra. 1994 : Maîtrise de Mathématiques Appliquées, Université de Toulon et du Var. 1.3. Principales responsabilités Mars 2012-- : membre élu du Conseil Scientifique de l'uapv, représentant sectoriel «Science, Technologie, Santé». 2012-- : membre du Conseil de direction du Labex Brain and Language Research Institute (BLRI), co-responsable de l'axe Neurocomputing and Language Processing. 2011-- : membre du Conseil de direction de la structure fédérative de recherche Agorantic, regoupant 6 laboratoires de l'uapv sur le thème Cultures, patrimoine et sociétés numériques. Avril 2010-- : Directeur du Laboratoire Informatique d'avignon (LIA, 65 personnes) UAPV. Avril 2010--: directeur adjoint du Centre d'enseignement et de Recherche en Informatique (CERI), Avignon. Décembre 2009-avril 2010 : directeur adjoint du LIA (directeur : Marc El-Bèze). 2000-2004 : Responsable de la licence d'informatique de l'iup Génie Mathématique et Informatique, UAPV (150 étudiants). 2000-2008 : membre du conseil de perfectionnement de l'iup GMI. 2002 à 2006:membre du conseil d'administration de l'iup-gmi. 2002 à 2006 : membre de la commission Hygiène & sécurité de l'uapv (2008/2010). 2 Activité scientifique 2.1. Thématiques de recherche Initialement centré sur la modélisation acoustique en reconnaissance automatique de la parole, le spectre de mes thématiques de recherche c'est élargi d'abord à l'ensemble des problèmes liés à la transcription automatique de la parole, puis à la structuration de collections multimédia et d'analyse des contenus parlés. Actuellement, mes principaux thèmes de recherche sont le traitement automatique de la parole, l'indexation audio, multimédia, multilingue. Ma thèse concernait la classification automatique et la détection de ruptures dans des environnements impulsifs. C'est un travail qui a principalement porté sur des problèmes d'apprentissage et de classification automatique (notamment avec l'analyse en composantes indépendantes), avec des applications à l'acoustique sous-marine et au traitement automatique de la parole. Je me suis ensuite intéressé à la modélisation du langage parlé (du signal à la sémantique), sur le "cœur" technologique des systèmes de reconnaissance de la parole mais aussi, plus récemment, sur l'exploitation et l'analyse des contenus parlés dans contextes variés (dialogue, indexation audiovisuelle, traduction automatique, multimédia, etc.). 2

J'ai d'abord contribué, principalement (mais pas exclusivement) avec Pascal Nocéra, au développement du système de reconnaissance de la parole du LIA (Speeral). Ce système a été engagé dans les campagnes d'évaluation ESTER 2005 et 2008, puis Etape 2012 et REPERE 2012/13. Il est librement distribuable sous licence LGPL. L'infrastructure logicielle développée à cette occasion au LIA a permis la validation expérimentale de nombreux travaux non seulement en reconnaissance de la parole, mais aussi, en aval, sur les problématiques d'analyse et d'exploitation des contenus parlés. La maintenance à l'état de l'art d'un tel système est un chantier permanent, auquel de nombreux chercheurs et doctorants contribuent mais que je coordonne depuis 2005. Mes recherches sur la reconnaissance de la parole se sont d'abord focalisées sur les aspects acoustiques (thèse de Christophe Lévy, soutenue en 2007 et co-encadrée avec J.F. Bonastre) puis avec celle de M. Bouallègue (co-encadrée avec D. Matrouf), sur la réduction des variabilités par analyse factorielle. Globalement, je me suis intéressé aux problèmes de fond de la modélisation statistique du signal de parole, avec des contributions sur la réduction de la redondance et des variabilités dans les modèles à mixture de Gaussiennes et la recherche d'espaces de représentation optimaux. A partir de 2004, j'ai élargi le spectre de mes activités aux stratégies de décodage de la parole, notamment dans le cadre de la thèse de Benjamin Lecouteux, soutenue en 2008. Nous avons proposé des techniques de combinaison de systèmes, notamment le principe du décodage guidé qui a été ré-investi dans des systèmes de détection d'expressions dans des flux audio (Master de M. Rouvier). Cet algorithme a été le point départ du projet ANR blanc ASH, dont je suis responsable scientifique LIA et de la thèse de Fethi Bougarès, qui a été soutenue en 2012 et que j'ai co-encadré avec Yannick Estève et Paul Deléglise, de l'université du Maine. La thèse de Stanislas OGER (soutenue en 2011) concerne l'utilisation du WEB comme source d'information pour l'estimation de modèles de langages Ad-Hoc et les modèles de langage basée sur la théorie des possibilités, approche originale qui sera prolongée dans le cadre de la thèse CIFRE de Killian Janod, qui débutera en 2013. Cette thèse adresse notamment le problème de l'augmentation lexicale et de l'estimation de scores linguistiques dans des domaines de spécialité, problématique centrale au projet ANR-RIAM AVISON dont j'ai été le coordinateur. Plus récemment, mes activités se sont orienté vers l'utilisation conjointe des techniques de RAP et de traitement de l'écrit pour l'analyse des contenus extraits, en particulier dans le cadre de tâches de structuration et d'indexation du WEB ou de grandes bases audiovisuelles. Ceci concerne plus particulièrement les thèmes : systèmes de transcription semi-automatiques pour l'indexation audiovisuelle: ce travail a été réalisé par Grégory Senay. Il s'agissait de développer des mesures d'indexabilité des transcriptions automatiques. transcription et traduction dans un domaine de spécialité. Ce thème a été l'objet de la thèse de Raphaël Rubino, soutenue en 2011, co-encadrée avec Philippe Langlais, de l'université de Montréal (laboratoire RALI) et Fabrice Lefevre, de l'uapv. l'audio dans le résumé multimédia, multi-documents : il s'agit d'un thème développé dans le cadre du projet ANR RPM2, dont j'ai été coordinateur LIA. L'objectif général du projet est de développer des méthodes permettant d'offrir à l'utilisateur d'un moteur de recherche des vues synthétiques du contenu WEB sur des sujets d'actualité. Nous avons travaillé sur les problèmes de résumé automatique et de catégorisation de vidéos par l'audio (thèse de M. Rouvier, soutenue en 2012). Nos contributions sur la détection du genre vidéo ont permis de montrer que l'audio portait une information caractéristique du genre. Cette tâche 3

a été évaluée lors de la campagne d'évaluation MediaEval 2011 ; nous avons obtenu la première place sur cette tâche, parmi 10 participants. Ce travail recoupe celui initié dans le cadre du projet EPAC, sur la détection de la parole spontanée. Il ouvre des perspectives intéressantes sur le croisement ou la combinaison de systèmes basés sur les modalités audio, texte et vidéo. Catégorisation multimédia, réseaux sociaux : le projet ANR SUMACC, dont je suis le porteur, concerne l'identification de concepts multimédias par patrons de collaboration. Il s'agit notamment de concevoir des signatures robustes à la diversité des concepts et de leur représentation sur l'internet. Cet intérêt pour le Web multimédia m'a conduit à coencadrer, avec Rachid El-Azouzi et Eitan Altman, la thèse de Cédric Richier sur l'analyse des réseaux sociaux ma contribution portant essentiellement sur les réseaux de contenus (projet européen CONGAS, FP7). 2.2. Production scientifique 100 publications scientifiques dont 7 revues référencées, 56 conférences internationales. Engagement dans 5 campagnes d'évaluation nationales et internationales, développement d'un logiciel de transcription automatique de la parole sous licence LGPL. 2.2.1 Synthèse des publications 5 revues internationales (IEEE Transaction on Speech, Audio an Language Processing, 2 Speech Communication, 2 Eurasip Speech, Audio and Music Processing). 2 revues sont en cours d évaluation (ACM, IEEE TSALP) 2 revues nationales (TALN) 56 conférences internationales avec comité de sélection et publication des actes, dont 14 dans les conférences majeures du traitement automatique de la parole (ICASSP, InterSpeech, ASRU, SLT), le reste principalement en Traduction Automatique, Multimédia, Traitement du langage naturel et Recherche d Information (ACM Multimedia, EAMT, CICLING,,...). 2 conférences invités 5 ateliers internationaux liés à la participation à des campagnes d évaluation (ESTER 2005, ESTER 2008, ETAPE, CLEF, MEDIAEVAL) 28 conférences nationales (principalement JEP, TALN), 1 rapport (HDR) 2.2.2 5 publications majeures Benjamin Lecouteux, Georges Linarès, Yannick Estève, Guillaume Gravier : Dynamic Combination of Automatic Speech Recognition Systems by Driven Decoding In IEEE Transaction on Speech and Audio Processing, 2013, accepté. Article traitant de la combinaison intégrée de systèmes de reconnaissance de la parole. Alors que les méthodes classiques opèrent en amont des systèmes, par mutualisation des bases de connaissance, ou en aval, par fusion des sorties des reconnaisseurs, ce papier propose une approche intégrée dans laquelle l'ensemble des systèmes évaluent des hypothèses qui sont à la fonction objectif de l'algorithme de décodage d'un système primaire. A la suite de ce travail, un ANR Blanc et une thèse (celle de Fethi Bougarès) ont été réalisés. Benjamin Lecouteux, Georges Linarès and Stanislas Oger : Integrating imperfect transcripts into speech recognition systems for building high-quality corpora. In Computer Speech and Language, Elsevier, 2012, 26(2): 67-89 (2012). 4

La question des corpus est essentielle en transcription automatique : cet article propose une méthode originale dans laquelle une transcription imparfaite (prompts de journalistes, scripts du film, etc.) est vu comme une source d'information qui peut être intégrée au processus de développement et d'arbitrage des hypothèses de reconnaissance. Driss Matrouf, Florian Verdet, Mickael Rouvier, Jean francois Bonastre, and Georges Linarès. Modeling nuisance variabilities with factor analysis for GMM-based audio pattern classification. In Computer Speech and Language, 25(3):481-498, 2011. La robustesse aux variabilités acoustiques est un point clé du traitement de la parole ; nous avons développé au LIA des méthodes de réduction de la variabilité acoustique par analyse factorielle. Les avancées réalisées en identification du locuteur sur ce thème nous ont incité à les adapter au problème d'identification du genre vidéo, avec succès. Ce papier dresse un panorama des fondements de l'approche et de ces applications à divers problèmes de traitement automatique de la parole (identification du locuteur, de la langue, du genre vidéo).. Rouvier Mickael, Georges Linarès, Benjamin Lecouteux Query driven strategy for on-the-fly term spotting in spontaneous speech Special Issue on Scalable AudioContent Analysis, EURASIP Journal on Audio, Speech, and Music Processing, 2009. Cet article présente une méthode de détection de mots-clefs basé sur l'extraction de sous graphes optimaux des graphes de prononciation. Outre l'algorithme d'extraction lui-même, l'intérêt de ce papier réside dans l'approche générale, qui consiste à construire un système en partant de la requête ; cette démarche se démarque des approches génériques classiques, dans lesquelles la requête est un paramètre d'exécution du système. 2.2.3 Logiciels, campagnes d évaluation La recherche en traitement automatique du langage nécessite des environnements logiciels lourds, qui peuvent être évalués dans le cadre de campagnes d'évaluation nationales ou internationales. L'engagement dans ces campagnes permet de confronter nos systèmes à l'état de l'art et d'obtenir des environnement expérimentaux de référence. Nous avons fait le choix de développer un système de reconnaissance de la parole ouvert (Speeral) et d'engager nos systèmes (celui ci et d'autres) dans les campagnes internationales. C'est un engagement lourd mais qui est une des bases du dynamisme de nos activités scientifiques et contractuelles : Développement du système de reconnaissance de la parole Speeral (speeral.univavignon.fr), Campagnes d évaluation en transcription enrichie ESTER (2005 & 3008), ETAPE (2011) Défi ANR REPERE, sur l'identification des personnes dans les flux audiovisuels (2011/14). Campagne d évaluation MEDIAEVAL 2011, sur les tâches Social Event Detection et Vidéo Genre Identification (première position sur un ensemble de 10 concurrents). INEX 2012 (prolongation des campagnes CLEF), sur la tâche de contextualisation de Tweets. 5

2.3. Encadrement et animation de la recherche Direction du Laboratoire Informatique d'avignon (65 personnes) depuis 2010. Coresponsable de l'axe Language Modeling and Neuro-computation du labex Brain and Language Research Institute. Participation à l'organisation de 2 colloques internationaux. Encadrement de 11 thèses, dont 7 soutenues. 2.3.1 Direction, animation laboratoire et équipes de recherche Un partie du travail d'encadrement et d'animation de la recherche est directement liée à des responsabilités que j'ai exercé depuis mon recrutement à l'uapv, et qui sont décrites plus précisément dans la section «Responsabilités collectives». De façon à éviter une redondance inutile, je me concentre dans cette section çi sur les sur les aspects scientifiques de ces fonctions. Direction du Laboratoire Informatique d'avignon (LIA, EA 4128) depuis avril 2010, directeur adjoint de janvier à avril 2010. Le LIA est une équipe d'accueil d'environ 65 personnes dont 24 enseignant-chercheurs permanents; son budget non-consolidé était d'environ 900K en 2011. Depuis 2010, nous avons fait évoluer le LIA significativement. Au niveau sructurel, nous avons créé le CERI (enseignement et recherche) et la fédération de recherche Agorantic, structure de l'uapv qui porte le volet pluridisciplinaire du projet scientifique du LIA, autour des sciences du Web. Par ailleurs, nous avons cherché à dynamiser une politique scientifique de laboratoire, par exemple en mettant en place des projets internes, financés par prélèvement sur contrats (environ 20K par an), et des stages doctorants à l'international (2 à 3 mois) soutenus financièrement. Représentant de la thématique Langage au conseil de direction du LIA. Le conseil de direction du LIA est formé de représentants de son personnel et d'un représentant de chacune des 3 thématiques majeures du laboratoire : Langage, Réseaux et Recherche Opérationnelle. La thématique langage regroupe plus de la moitié des effectifs de l'unité; j'ai été élu représentant de cette thématique au conseil de direction du LIA, avant d'en devenir le directeur. Co-responsable de l axe Neurocoputation and language processing du Labex BLRI, avec Jonathan Grainger, et membre de son conseil de direction (Brain and Laguage Research Institute). Ce labex associe plusieurs laboratoires d'amu et le LIA sur l'étude du langage, de ses fondements neuro-cognitifs aux questions de modélisation et de traitement automatique. Outre l'effet structurant et dynamisant du dispositif, le Labex nous permet de nous engager sur des projets à moyens termes (de 5 à 8 ans), complémentaires de projets ANR et européens, plus courts, qui constituent l'essentiel de notre financement non récurrent. Membre du comité de direction de la Fédération de Recherche Agorantic: structure pluridisciplinaire, regroupant 6 laboratoires de l'uapv autour des sociétés numériques comme objet d'étude commun aux STIC et aux SHS. Je suis notamment le co-responsable de l'axe Réseaux sociaux et culturels du Web, avec Rachid El-Azouzi et Marie Claude Fourquet,. Agorantic est en voie de labellisation par le CNRS. 2.3.2 Participation aux comités d'organisation de manifestations scientifiques Comité d'organisation de InterSpeech 2013 : 1200 participants attendus; Lyon (ISCA, INRIA/AFCP). Resp. Exposants. 6

Co-Organisation, avec Bernard Mérialdo et Clément Le Groc, de la Session spéciale de Wiamis 2013 (14th Intenational workshop on Image and Audio Analysis for Multimedia Interactive Services, IEEE): Automatic categorization of multimedia web data, monomodal and multi-modal approaches, juillet 2013 Comité d'organisation de European Chapter of the ACL (EACL) 2012; 400 participants; en charge du budget, avec Tania Jimenez. Avignon (ACL) Journées ATALA/GDR Isis/AFCP sur le Résumé Multimédia (2011, 50 participants) Organisation locale du Workshop ESTER 2005, UAPV Comité d'organisation de JEP/TALN 2008 (300 participants), UAPV, Juin 2008 Direction du comité scientifique des Rencontres des Jeunes Chercheurs en Parole, en 2009 (RJCP/Majestic 150 Participants, UAPV, Novembre 2009) Co-organisation de la session Robust Speech Recognition, Acoustics 2008 (4500 participants au total), Paris. Avec Olivier Siohan, Google Inc. Comité d'organisation de JEP 1998 (150 participants), UAPV, juin 1998 2.3.3 Direction de thèse et autres travaux Thèses soutenues Christophe Lévy (oct. 2003, nov. 2007, 50 %) : Modèles acoustiques compacts pour les systèmes de reconnaissance de la parole embarquée ; co-encadrement avec Jean-François Bonastre. Financement CIFRE par la société Stepmind. Benjamin Lecouteux (nov 2005 déc 2008 ; 100%) : Reconnaissance de la parole guidée par des transcriptions à priori. Situation actuelle : Maître de Conférence, UJF, Grenoble Grégory Senay (nov. 2007 nov. 2011 ; 100 %): Approches semi-automatiques pour la recherche d'information dans des documents audio. Situation actuelle : ATER, UAPV. Mickael Rouvier (oct. 2008 juillet 2012 ; 100 %): Structuration de documents audiovisuels pour le résumé automatique. Situation actuelle : post-doc, LIUM -Université de Maine. Stanislas Oger (oct. 2006- nov. 2011 ; 100 %), Modèles de langage Ad-hoc pour la reconnaissance automatique de la parole. Situation actuelle : chef d'entreprise. Raphael Rubino (oct. 2008 ; nov. 2011 ; 50 %): Traduction automatique statistique et adaptation à un domaine spécialisé (co-encadrement avec Philippe Langlais (15%), Université de Montréal, et Fabrice Lefevre, UAPV (35%). Situtation actuelle : Chercheur sous contrat à Dublin City University Symantec. Fethi Bougarès (nov. 2009-déc. 2012; 30 %): Attelage de systèmes de reconnaissance automatique de la parole (co-encadrement avec, Paul Deléglise (30%) et Yannick Estève (40%). Situation actuelle : postdoc à l'université du Maine. Thèses en cours Mohamed Bouallègue (avril 2009-;40 %): Analyse factorielle pour la reconnaissance automatique de la parole. Co-encadrement avec D. Matrouf (UAPV, 60%). Benjamin Mazza (oct. 2010-;33 %): Extraction d'information pour la supervision d'une centre d'appel (co-direction avec Marc El-Bèze (UAPV, 33%), R. De Mori (UAPV, 33%) Mohamed Morchid (oct. 2011- ; 100 %): Découverte et identification de concepts multimédias. Cédric Richier (oct. 2012- ; 30 %) : Cooperative and competitive content dissemination in social networks (co-encadrement avec Eitan Altman (INRIA Sophia Antipolis, 30 %) et Rachid El-Azouzi (UAPV, 40 %). 7

2.4. Valorisation de la recherche Responsabilité de 5 ANRs dont 2 en tant de porteur ; de 2 contrats industriels (CIFRE) et 2 en cours de finalisation. Participation à 2 ANRs en cours, 2 projets européens, nombreuses collaborations industrielles. Une grande partie de mon travail de recherche a été réalisé dans le cadre de projets collaboratifs, dont j'ai eu la responsabilité ou auxquels j'ai participé. Il s'agit à la fois d'une activité scientifique, d'animation, d'encadrement, d'une responsabilité collective lorsqu'il 'agit de monter et gérer les projets et de valorisation lorsqu'ils sont réalisés en partenariat avec des industriels. 2.4.1 Responsabilité de projets financés CONTNOMINA (ANR BLANC 2013-, responsable pour le LIA, 95K ). Thème : reconnaissance des noms propres et contextualisation des systèmes de reconnaissance de la parole. Rôle : reconnaisance de la parole, modèles de contextes. Partenaires : LORIA (Université de Loraine), LIA. SUMACC (ANR CONTINT 2011-2014, porteur du projet, 250K ). Thème : identification de concepts multimedia par Patrons de collaboration. Rôle dans le projet : coordination, extraction d'information des contenus audio, apprentissage semi-automatique. Partenaires : Eurecom, Syllabs, Wikio. ASH (ANR BLANC 2009-20012, responsable pour le LIA, 90K ). Thème : combinaison de systèmes de reconnaissance de la parole hétérogènes. Rôle : combinaison par décodage guidé. Partenaires : LIUM (Université du Maine), IRISA Renne. AVISON (ANR RIAM, 2008-2012, porteur du projet, 265K ). Thème : indexation de vidéos multilingues dans le domaine médical. Rôle : indexation audio, multilinguisme. Partenaires : Institut de Recherche contre les cancers de l'appareil digestif (IRCAD, société Xtensive Technologie). RPM2 (ANR CONTINT 2008-2012, responsable LIA, 190K ). Thème : résumé multimédia, multi-documents. Rôle : résumé audio, catégorisation par l'audio, résumé vidéo. Partenaires : Eurecom, Wikio, Sinequa, Syllabs. Participation aux contrats industriels (liste non exhaustive ) : DGA (dans le cadre de ma thèse, classification automatique), Peugeot (commande vocale), VoiceInsight (indexation audio), StepMind (thèse CIFRE de C. Lévy), DATOPS,... Responsabilité des collaborations contractualisée : Société Xtensive (CIFRE, 2008-2011, porteur, 27K ) : indexation multimédia, industrialisation du système de reconnaissance de la parole, adaptation rapide (thèse de Gregory Senay). Société ETT (CIFRE, 2009-2012, porteur, 60K ) : transcription assistée par ordinateur, robustesse des systèmes de reconnaissance de la parole (thèse de Mohamed Bouallègue). Société Orkis (demande de CIFRE en cours) : indexation et résumé multimédia (thèse CIFRE en cours d'évaluation). Société EDD (dossier CIFRE en cours de finalisation) : supervision de flux d'informations simultanés. 2.4.2 Participation à des projets financés (liste non exhaustive se limitant aux projets très récents ou en cours). CONGAS : projet européen (FP7) débuté mi-2012, sur l'analyse multi-échelle des réseaux 8

complexes avec des applications aux réseaux sociaux. Rôle : extraction et la structuration par les contenus (co-encadrement de la thèse de Cédric Richier, 2012-). Partenaires : InsipreGroup (It), DELFT (NL), INRIA (FR), FNS (UK), University of Pisa (It) PERCOL : défi ANR CONTINT 2011 sur la recherche de personnes dans des flux audiovisuels. Rôle : recherche d'entités nommées dans le flux parlé (co-encadrement de Benjamin Bigot et Gregory Senay, post doctorant et ATER au LIA). Partenaires : Orange Lab, LIF, LILF. DECODA : ANR CONTINT 2010. Thème : analyse des contenus et la supervision des centres d'appels. Rôle : extraction des contenus parlés, analyse des dialogues (coencadrement de Benjamin Mazza, 2010-). Partenaires : LIF, RATP, Sonear HARTES : projet européen FP6. Thème : approches holistiques pour développement de solutions embarquées. Rôle : participation à l'intégration de briques logicielles de traitement de la parole (décodage phonétique). 2.5. Rayonnement Participation à 5 comités de sélection, 1 commission de spécialistes, 10 jurys de thèse. Présence sur les principales activités collectives de la communauté scientifique (relectures, participation et administration des sociétés savantes, organisation de manifestation, collaborations nationales et internationales). Comités de spécialistes : Université de Loraine (poste professeur section 27, 2012), UAPV (section 27, 2 comités en 2011 et 2 en 2012, présidence de 2 de ces 4 comités). Membre de la comission de spécialiste de l'uapv de la commission de spécialistes sections 27/61 de 2000 à 2004. Jurys de thèse : Florian Pinault (UAPV, président du Jury), Yingbo LI (Eurecom, président du Jury), DO Diep (LIG, Grenoble, rapporteur), Pierre Gotab (UAPV, rapporteur), Fethi Bougarès (LIUM), B. Lecouteux, S. Oger, M. Rouvier, R. Rubino, G. Senay (dir. Thèses). Relectures : IEEE Transaction on Multimedia, Speech Communication, IEEE ICASSP, Interspeech, ASRU, SLT, Multimedia tools & application, CBMI, Eusipco, JEP, RFIA...Comité scientifique des JEP, présidence du comité scientifique de Majestic 2009. Sociétés savantes : membre de IEEE/SPS, ACL, ISCA; conseil d'administration de l'afcp (Association Francophone de la Communication Parlée) de 2006 à 2008, suppléant de 2008 à 2012). Membre ATALA, ARIA. Participation au jury des prix de thèse AFCP (2006-2010), ATALA (à venir : 2013). Evaluations : ANR, ANRT (CIFRE), projets INRIA. Invitations : University College, Dublin Young researchers Workshop in Speech Technology, Keynote : "Speech recongnition : is this the end?"), 2009. Université de Lorraine : invitation pour un séminaire sur les "Modèles possibilistes en TALN", mars 2012. Réseau d'excellence PASCAL II, tutorial pascal Bootcamp, "Speech Processing", St Charles, Marseille, 2011. Séminaire du Centre Norbert Elias "Phénomène de contagion critique sur le Web", Cannes, Mai 2012 Collaborations académiques : Berkeley (publication commune), LORIA (projet ANR Cont- Nomina), IRISA (publications communes, projet ASH), LIUM (publications communes, coencradrement d'une thèse), Univ. De Montréal (co-encadrement de thèse), EURECOM (projet et publication communes),... Réseaux de recherche : correspondant local du réseau MetaNet, du GDR-Isis; implication dans le GDRI France-Brésil (visite en déc. 2012 et projet de collaboration avec le Brazilan Institute for Web Science Research). Collaborations Industrielles : Orange Labs, Wikio, Sinequa, Syllabs, ETT, Xtensive Technologies, IRCAD, Sonear, RATP, Orkis... 9

3 Présentation de l'activité d'enseignement Enseignement essentiellement réalisé à l'iup GMI puis au CERI. Depuis 2004, pour moitié en licence et moitié en Master. 3 axes : fondamentaux de l'informatique (modélisation & algorithmique), architectures distribuées et un dernier, lié aux activités de recherche, en traitement du langage (cours et projets) Type Algorithmique, & Génie logiciel Architectures Distribuées Traitement Automatique de la Parole (M2), Projets Responsabilité des Unités d'enseignement Algorithmique (L3), Modélisation Objet I (L2) et II (L3), Projet Programmation (L2), Génie logiciel(l2), IHM-C#,L2) Architectures d'intégration, Mise en Œuvre des services Web, MiddleWare Objet Projets M1, Projets de fin d'étude (M2), cours de TAP Répartition service d'enseignement Niveau 50% Licence 2 et 3 30% Master 1 et 2 15% Master 2 Tableau 1 : ce tableau présente une estimation de répartition moyenne de mon service depuis 2004 sur les 3 axes principaux des matières que j'enseigne : programmation, architecture et traitement de la parole. Depuis 1999, l'essentiel de mes enseignements s'est déroulé à l'iup Génie Mathématique et Informatique de l'uapv, puis au CERI (Centre d'enseignement et de Recherche en Informatique). Mon service est partagé également entre la licence et le Master, avec trois types d'enseignements (synthétisés dans le tableau 1) : enseignements sur les bases techniques de l'informatique, en particulier sur la modélisation objet, la programmation et le Génie Logiciel. Malgré un goût certain pour l'algorithmique, j'éprouve beaucoup de plaisir à enseigner les aspects méthodologiques et conceptuels du développement logiciel, parce qu'ils obligent les étudiants à s'interroger sur leurs pratiques et à mettre leur activité en contexte et en perspective. J'ai contribué à différents cours sur cet axe : Modélisation Objet (support JAVA, CM/TP/TD), Programmation Algorithmique Avancée (support C++, CM/TP/TD), Interfaces Hommes/Machines (support C#, TP), Projets de Programmation, Lorsque la philosophie, les bases «culturelles» et la méthodologie de l'algorithmique et du génie logiciel sont acquises, les questions de savoir-faire deviennent moins critiques... architectures d'intégration : il s'agit d'enseignements qui visent à ouvrir les étudiants aux architectures logicielles réparties, dans différents contextes technologiques. Je suis notamment responsable de l'unité d'enseignement «Architectures Distribuées», dans laquelle j'ai la charge des cours de Middleware (supports CORBA, ICE, ActiveMQ) et Mise en œuvre des Services Web (2009-2011). Il s'agit de technologies en constante évolution, dont l'enseignement est assez chronophage mais qui obligent aussi à rester en 10

contact permanent avec les problématiques et les environnements nouveaux auxquels les industriels sont confrontés. le troisième volet regroupe des enseignements qui sont plus directement liés à mes activités de recherche, soit dans le cadre du cours de Traitement automatique de la parole et interactions vocales, soit dans celui de divers cours auxquels j'ai participé et qui comportaient un volet traitement automatique du langage, soit encore dans le cadre de projets très divers dans lesquels je propose, très souvent, des sujets qui sont liés au TALN écrit ou oral. Ça a été par exemple le cas de projets de suppression automatique de la publicité dans des flux vidéos (plugin VLC), de correction orthographique par des modèles n-grammes, de modèles prédictifs de la popularité de vidéos YouTube, etc... Niveau CM TP/TD Durée Formation Responsabilité Modélisation Objet L2 12 24 >6 ans IUP/CERI Oui (2004-2010) Modélisation Objet II L3 9 24 2002- IUP/CERI Non Algorithmique et programmation L2 20 2 PREPA Non Projet de Programmation L2 24 1998-2002 IUP Non Programmation ALgorithmique Avancée L3 2000/2001 IUP Oui (2 ans) Génie Logiciel L2 18 24 2006- IUP/CERI Oui Interface Homme/Machine (C#) M1 18 2011- CERI Non Architectures d'intégration M1 12 24 2000/2007 IUP/CERI Oui (2000/2006) MiddleWare M1 12 24 2008- CERI Oui (2007- Mise en Oeuvre des Services Web M1 9 24 2008/2010 CERI Oui (2008/2011) Services dans les Réseaux M1 24 2010 CERI Non Traitement Automatique de la parole M2 12 12 2004/2010 IUP/CERI Oui (2009/2010) Traitement Automatique de la parole et Interaction vocales M2 6 9 2010/2011 CERI Non Projets M1/M2 10-30 2000- IUP/CERI Tableau 2 : synthèse des principales matières enseignées, avec un estimatif des volumes horaires (qui variables en fonction des années). 4 Responsabilités Collectives Responsabilités en enseignement (licence d'informatique pendant 5 ans, conseil d'administration et de perfectionnement de l'iup GMI, conseil de direction du CERI), en Recherche (direction du LIA, conseils de direction d'une Fédération de recherche et d'un Labex, conseil scientifique de l'uapv). 4.1. Présentation générale Dès mon recrutement en 1999, j'ai assumé des charges collectives lourdes, en particulier en prenant la responsabilité de la licence. La précocité de cet engagement était lié au contexte particulier de l'iup GMI, qui connaissait une très forte croissance de ses effectifs et une faiblesse des taux d'encadrement...la structure demandait donc beaucoup à chacun d'entre nous et c'est volontier que j'ai pris ces responsabilités dans le contexte tendu, mais aussi enthousiasmant d'une formation récente et en développement. Reste que la faiblesse du support technique et administratif nous obligeait à prendre en charge de très nombreuses 11

tâches dont certaines auraient pu être confiées à des administratifs : emploi du temps, gestion des stages, suivi des étudiants, échanges internationaux dans le cadre d'erasmus,... Le manque de personnels de support est chronique à l'uapv et se fait évidemment sentir aussi en recherche : j'ai par exemple la responsabilité de l'administration du parc de serveurs du LIA de 2002 à 2010 (plus de 300 cœurs aujourd hui). Au delà de l'aspect très pratique (et parfois ingrat) de la gestion quotidienne d'une formation, j'ai bien entendu participé aux pilotage de la structure : conseil de perfectionnement de 2000 à 2008 conseil d'administration de 2002 à 2006, commission de spécialistes sections 27/61 de 2000 à 2004... En 2008, les IUP ont disparus et ce changement de cadre a fragilisé la position des formations en informatique de l'uapv : la baisse de visibilité et l'affaiblissement de nos liens avec les industriels conduisait à la perte de ce qui avait fait le succès des IUP. Nous avons donc cherché à construire une structure nouvelle permettant de mettre en avant nos atouts spécifiques, notamment de mieux tirer parti du rayonnement du laboratoire de recherche. Ceci a conduit à la création du CERI en 2010, dont la vocation est de dynamiser les synergies enseignement/recherche, de mutualiser des moyens, de communiquer ensemble et de tirer le meilleur bénéfice des relations privilégiées que nous entretenons avec l'industrie. J'ai contribué significativement à ce projet collectif, par exemple en coordonnant la rédaction de ses premiers statuts alors que j'étais directeur adjoint du LIA. En avril 2010, le CERI a été créé et la direction du laboratoire de recherche m'a été confiée. Cette création coïncide avec le passage de l'uapv aux RCE et la ré-organisation des UFR, qui peuvent désormais inclure des structures telles que le CERI, appelées départements d'enseignement et de recherche. Depuis 2011, les effectifs éudiants du CERI sont en nette croissance; toutes les formations ont été certifiées ISO 9001. Plus des 2/3 des effectifs du Master suivent leur formation en alternance. Les taux d'insertions à 2 ans sont de 98.7%. La direction du laboratoire m'a été confiée à un moment charnière, précédant l'évaluation AERES (prévue en 2011 et décalée tardivement en 2012) et les appels d'offre liés aux investissements d'avenir (IA), tout ça dans le contexte, deja évoqué, du passage à l'autonomie de l'uapv et de la mise en place effective du CERI. Le LIA a été noté A+ sur chacun des critères production, rayonnement, gouvernance et projet lors de cette évaluation AERES qui a eu lieu en 2012. Nous avons participé à 4 réponses aux appels IA : 2 équipex (portés par M. EL-Bèze, du LIA) et deux labex (dont j'avais la responsabilité pour le LIA). Cet engagement a abouti à la labellisation du laboratoire d'execellence Brain and Laguage Research Institute (BLRI) en 2012. Je suis membre du conseil de direction de ce Labex et co-responsable de l axe Neurocoputation and language processing avec Jonathan Grainger (LPC, AMU). Par ailleurs, les RCE et la situation particulière de l'uapv, qui est une petite université, ont conduit la direction de l'établissement à mettre en avant deux thèmatiques phares de l'université, l'une centré sur les Agrosciences, l'autre sur Culture, patrimoine et société numérique. De façon à jouer notre rôle dans ce projet, nous nous sommes fortement engagés dans cette dernière thématique, notamment en étant moteurs dans la création de la structure fédérative de recherche qui porte le volet pluridisciplinaire de ce projet. Cette fédération est co-dirigée par Marc El-Bèze, du LIA, et Marie Sylvie Poli, du centre Norbert Elias. Je suis membre de son comité de direction. 4.2. Synthèse des responsabilités administratives Mars 2012-- : représentant sectoriel élu «Science, technologie, Santé» au Conseil Scientifique de l'uapv, en charge du programme «Visiteurs courtes durées», qui vise à soutenir l'accueil de chercheurs pour des périodes inférieures à 15 jours. 2012-- : membre du Conseil de direction du Labex Brain and Language Research Institute (BLRI),co-responsable de l'axe Neurocomputing and Language Processing 12

2011-- : membre du Conseil de direction de la structure fédérative de recherche Agorantic, regoupant 6 laboratoires de l'uapv sur le thème Cultures, patrimoine et sociétés numériques Avril 2010-- : Directeur du Laboratoire Informatique d'avignon (LIA, 65 personnes) UAPV Avril 2010--: directeur adjoint du Centre d'enseignement et de Recherche en Informatique (CERI), Avignon Décembre 2009-avril 2010 : directeur adjoint du LIA (directeur : Marc El-Bèze) 2000-2008 : membre du conseil de perfectionnement de l'iup GMI 2002 à 2006: membre du conseil d'administration de l'iup-gmi. 2002 à 2006 : membre de la commission Hygiène & sécurité de l'uapv (2008/2010). Membre du Conseil d'administration de l'afcp, 2006-2008 2000-2004 : responsable de la licence d'informatique de l'iup Génie Mathématique et Informatique, UAPV (150 étudiants) 2000-2004 : membre de la commission de spécialistes 27/61 (UAPV). Commission matérielle du LIA (coordination de l'administration du parc serveurs, 300 cœurs en 2012). 13

Annexes Liste classée des publications Ouvrages collectifs 1. Christophe Lévy, Georges Linarès, Pascal Nocera, Jean-françois Bonastre, Embedded mobile phone digit-recognition Chapitre 7, Springer Science, 2007. Revues internationales à comité de lecture 2. Benjamin Lecouteux, Georges Linarès, Yannick Estève, Guillaume Gravier : Dynamic Combination of Automatic Speech Recognition Systems by Driven Decoding In IEEE Transaction on Speech and Audio Processing, à paraître, 2012. 3. Benjamin Lecouteux, Georges Linarès and Stanislas Oger : Integrating imperfect transcripts into speech recognition systems for building high-quality corpora. In Computer Speech and Language, 2012, 26(2): 67-89 (2012) 4. Driss Matrouf, Florian Verdet, Mickael Rouvier, Jean francois Bonastre, and Georges Linarès.Benjamin Lecouteux, Pascal Nocéra, Georges Linarès Modeling nuisance variabilities with factor analysis for GMM-based audio pattern classification. In Computer Speech and Language, Elsevier, 25(3):481-498, 2011. 5. Christophe Lévy, Georges Linarès, J-F Bonastre Compact acoustic models for embedded speech recognition EURASIP Journal on Audio, Speech, and Music Processing, 2009. 6. Rouvier Mickael, Georges Linarès, Benjamin Lecouteux Query driven strategy for on-the-fly term spotting in spontaneous speech Special Issue on Scalable AudioContent Analysis, EURASIP Journal on Audio, Speech, and Music Processing, 2009. Revues nationales à comité de lecture 7. Thierry Bazillon, Vincent Jousse, Frédéric Béchet, Yannick Estève, Georges Linarès, Daniel Luzzati, La parole spontanée: transcription et traitement Revue Traitement Automatique des Langues, TAL, 2008. 8. Audrey Burki, Cé Gendrot, Guillaume Gravier, Georges Linarès, Cécile Fougeron, Alignement automatique et analyse phonétique: comparaison de différents systèmes pour l'analyse du schwa Revue Traitement Automatique des Langues, TAL, 2008. Conférences internationales avec comité de lecture et publication des actes 9. Mohamed Bouallègue, Driss Matrouf, Emmanuel Ferreira, Georges Linarès, Maria Goudi, Pascal Nocera : Acoustic modeling for under-resourced languages based on vectorial HMM-states representation using subspace gaussian mixture models. In IEEE Speech and Language Technology Workshop (SLT), Miami, USA, to appear, 2012. 10.Mohamed Bouallègue, Mickael Rouvier, Driss Matrouf, Georges Linarès : Subspace Gaussian Mixture Models Based on Noise Compensation for Speech Recognition In International conference of the Speech Communication Association, ISCA, 14

InterSpeech'12, Portland, USA, 2012. 11.Fethi Bougares, Mickael Rouvier, Yannick Esteve, Geores Linarès : Low latency combination of parallelized single-pass LVCSR systems. In International conference of the Speech Communication Association, ISCA, InterSpeech'12, Portland, USA, 2012. 12.Gregory Senay, Benjamin Lecouteux, Georges Linarès : Confidence measure for speech indexing based on Latent Dirichlet Allocation. In International conference of the Speech Communication Association, ISCA, InterSpeech'12, Portland, USA, 2012. 13.Raphael Rubino, Stéphane Huet, Fabrice Lefèvre and Georges Linarés : Statistical Post-Edition of Machine Translation for Domain Adaptation. In EAMT, 16th conference of the European Association for Machine Translation, Trento, Italy, 2012. 14.Raphael Rubino and Georges Linarès. A multi-view approach for term translation spotting. In Conference on Intelligent Text Processing and Computational Linguistics (CICLing), 2011, Tokyo, Japan Lecture Notes in Computer Science, Volume 6609/2011, 29-40, DOI: 10.1007/978-3-642-19437-5_3, Tokyo, 2011 15.Mohamed Bouallegue, Driss Matrouf, and Georges Linarès. A simplified subspace gaussian mixture to compact acoustic model for speech recognition. In IEEE ICASSP, International Conference on Acoustic, Speech and Signal Processing, Prague, CZ, 2011. 16.Gregory Senay, Benjamin Lecouteux, Georges Linarès. A segment-level confidence measure for spoken document retrieval. In ICASSP, International Conference on Acoustic, Speech and Signal Processing, Prague, CZ, 2011. 17. Benjamin Mazza, Marc El-Beze, Georges Linarès, and Renato De Mori. On the use of linguistic features in an automatic system of speech analystics of telephone conversations. In ISCA InterSpeech 2011, Firenza, Italy, 2011. 18.J. Yingbo, B. Merialdo, M. Rouvier, and G. Linarès. Static and dynamic video summaries. In ACM Multimedia Conference, Scottsdale, Arizona, USA, 2011. 19.G. Senay, S. Oger, R. Rubino, G. Linarès, and Parent Thomas. Audio indexing on a medical video database: the Avison project. In International Conference on BioMedical Engineering and Informatics (BMEI'11), Shangai, China, 2011. 20.M. Bouallegue, M. Rouvier, D. Matrouf, and G. Linarès. Subspace gaussian mixture models for vectorial HMM-states representation. In ASRU, Automatic Speech Recognition and Understanding Workshop, IEEE, Hawai, USA, 2011. 21.F. Boughares, Y. Estève, P. Deléglise, and G. Linarès. Bag of n-grams driven for LVCSR system harnessing. In ASRU, Automatic Speech Recognition and Understanding Workshop, IEEE, Hawai, USA, 2011. 22.M. Rouvier nad M. Bouallegue, D. Matrouf, and G. Linarès. Factor analysis based session variability compensation for automatic speech recognition. In ASRU, Automatic Speech Recognition and Understanding Workshop, IEEE, Hawai, USA, 2011. 23.Benjamin Lecouteux, Pascal Nocéra, Georges Linarès Semantic cache model driven speech recognition In IEEE International Conference on Speech Audio and Signal Processing, ICASSP, 2010. 24.Benjamin Lecouteux, Raphael Rubino, Georges Linarès Improving backoff models with bag of words and hollow-grams In International conference of the Speech Communication Association, ISCA, InterSpeech'10, Tokyo, Japan, 2010. 25.Benjamin Lecouteux, Pascal Nocéra, Georges Linarès Décodage guidé par un modèle cache sémantique In Journées d'études de la parole, JEP 2010, Mons, Belgique, 2010. 26.Georges Linarès Speech Processing In BootCamp 2010, PASCAL Network of excellence, Marseille, 2010. 27.Stanislas Oger, Mickael Rouvier, Georges Linarès Transcription-based video genre classification In International Conference on Speech Audio and Signal Processing, 15

ICASSP, 2010, Dallas, USA, 2010. 28.Stanislas Oger, Vladimir Popescu, Georges Linarès Combination of Probabilistic and Possibilistic Language Models In International conference of the Speech Communication Association, ISCA, InterSpeech'10, Tokyo, Japan, 2010. 29.Mickael Rouvier, Georges Linarès, Driss Matrouf On-the-fly Video genre classification by combination of audio features In International Xonference on Speech Audio and Signal Processing, 2010. 30.Mickael Rouvier, Richard Dufour, Georges Linarès, Yannick Estève A Languageidentification inspired method for spontaneous speech detection In International conference of the Speech Communication Association, ISCA, InterSpeech'10, Tokyo, Japan, 2010. 31.Gregory Senay, Georges Linarès, Benjamin Lecouteux, Stanislas Oger Thierry Michel Transcriber driving strategies for transcription aid system In Language Resource and Evaluation, LREC 2010, Malte, 2010. 32.Richard Dufour, Vincent Jousse, Yannick Estève, Fréderic Béchet, Georges Linarès Spontaneous Speech Characterization and Detection in Large Audio Database In In proceedings of Speech and Computer SPECOM, Saint Petersbourg, Russia, 2009. 33.Richard Dufour, Vincent Jousse, Yannick Estève, Frédéric Béchet, Georges Linarès Spontaneous Speech Characterization and Detection In First Young Researchers Workshop on Speech Processing, UCD (ed.), Dublin, Ireland, 2009. 34.Benjamin Lecouteux, Georges Linarès, Benoit Favre Combined low level and high level features for Out-Of-Vocabulary Word detection In Conference of the International conference of the Speech Communication Association, InterSpeech, ISCA (ed.), Brighton, UK, 2009. 35.Stanislas Oger, Vladimir Popescu, Georges Linarès Probabilistic and Possibilistic Language Models Based on the World Wide Web In Conference of the International conference of the Speech Communication Association, InterSpeech, ISCA (ed.), Brighton, UK, 2009. 36.Stanislas Oger, Vladimir Popescu, Georges Linarès Using the Word Wide Web for learning new words in Continuous Speech recognition tasks : two case studies In Speech and Computer SPECOM, Saint Petersbourg, Russia, 2009. 37.Mickael Rouvier, Georges Linarès, Driss Matrouf Robust Audio-based Classification of Video Genre In Conference of the International conference of the Speech Communication Association, InterSpeech, ISCA (ed.), Brighton, UK, 2009. 38.Mickael Rouvier, Driss Matrouf, Georges Linarès Factor Analysis for Audio-based Video Genre Classification In Conference of the International conference of the Speech Communication Association, InterSpeech, ISCA (ed.), Brighton, UK, 2009. 39.Loic Barrault, Driss Matrouf Georges Linarès Christophe Servan, Renato De Mori Frame-Based Acoustic Feature Integration for Speech Understanding In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Las Vegas, USA, 2008. 40.Lecouteux Benjamin, Linarès Georges Using prompts to produce quality corpus for training automatic speech recognition systems In MELECON, IEEE, 2008. 41.Benjamin Lecouteux, Georges Linarès, Yannick Estève, Guillaume Gravier Generalized driven decoding for speech recognition system combination In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Las Vegas, USA, 2008. 42.Stanislas Oger, Georges Linarès, F. Béchet, Pascal Nocera On-Demand New Word Learning Using the World Wide Web In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, 2008. 43.Stanislas Oger, Georges Linarès, F. Béchet Local methods for on-demand out-ofvocabulary word retrieval In International conference on Language, Resources and 16

Evaluation (LREC), Marakech, Maroc, 2008. 44.Mickael Rouvier, Georges Linarès, Benjamin Lecouteux On-the-fly term spotting by phonetic filtering and request-driven decoding In IEEE Speech and Language Technology Workshop (SLT), Goa, India, 2008. 45.Benjamin Lecouteux, Georges Linarès, Yannick Estève, Julie Mauclair System Combination by Driven Decoding In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Georges Linarès (ed.), Volume 4, Pages 0-341, Hawaii, USA, 2007. 46.Benjamin Lecouteux, Georges Linarès, Frédéric Beaugendre, Pascal Nocéra Text island spotting in large speech databases In International Conference on Speech Communication and Technology, Interspeech, Pitsburg, USA, 2007. 47.Georges Linarès, Christophe Lévy Fast discriminative training of semi-continuous HMM In Lecture Notes in Computer Science, International Conférence on Speech, Text and Dialogue (ISCA), Volume 4629/2007, Pilsen, 2007 48.Georges Linarès, Pascal Nocéra, Dominique Massonié, Driss Matrouf The LIA speech recognition system : from 10xRT to 1xRT In Lecture Notes in Computer Science, International Conférence on Speech, Text and Dialogue (ISCA), Volume 4629/2007, Pages 0-308, Pilsen, 2007. 49.Georges Linarès, Dominique Massonié, Pascal Nocéra, Christophe Lévy A scalable system for embeded large vocabulary continuous speech recognition In IEEE Workshop on DSP in Mobile and vehicular systems, Istanbul, Turkey, 2007. 50.Christophe Lévy, Georges Linarès, J-F Bonastre Fast adaptation of GMM-based compact models In International Conference on Speech Communication and Technology, Interspeech, Pitsburg, USA, 2007. 51.Benjamin Lecouteux, Georges Linarès, J-F Bonastre, Pascal Nocera Imperfect Transcript Driven Speech Recognition In International Conference on Speech Communication and Technology, Interspeech, Pittsbug, USA, 2006. 52.Christophe Lévy, Georges Linarès, J-F Bonastre GMM-based acoustic modeling for embedded speech recognition In International Conference on Speech Communication and Technology, Interspeech, 2006. 53.Georges Linarès, Pascal Nocéra, Bertrand Ravera Automatic transcription of TETRAtranscoded broadcast news In IEEE Workshop on DSP in Mobile and vehicular systems, Sessimbra, Portugal, 2005. 54.Christophe Lévy, Georges Linarès, J-F Bonastre Mobile phone embedded digitrecognition In IEEE Workshop on DSP in Mobile and vehicular systems, Sesimbra, Portugal, 2005. 55.Domique Massonié, Pascal Nocéra, Georges Linarès Scalable Language Model Look- Ahead for LVCSR In International Conference on Speech Communication and Technology, Interspeech, Lisboa, Portugal, 2005. 56.Christophe Lévy, Georges Linarès, Pascal Nocera, J-F Bonastre Reducing computational and memory cost for cellular phone embedded speech recognition system In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Montréal, Canada, 2004. 57.Pascal Nocera, Corinne Fredouille, Georges Linarès, Driss Matrouf, Sylvain Meignier, JF Bonastre, Dominique Massonié, Frédéric Béchet The LIA's French Broadcast News Transcription System In SWIM: Lectures by Masters in Speech Processing, Maui, Hawaii, 2004. 58.Laurent Barcharolli, Georges Linarès, J-P Costa, J-F Bonastre Nonlinear GSM Echo Cancellation: Application to Speech Recognition In Non Linear Speech Processing NoLisp, Le Croisic, France, 2003. 59.Olivier Bellot, Driss Matrouf, Pascal Nocéra, Georges Linarès, J-F Bonastre Structural Speaker Adaptation Using Maximum A-Posteriori Approach and a Gaussian 17

Distribution Merging Technique In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Genève, Switzerland, 2003. 60.Christophe Lévy, Georges Linarès, Pascal Nocera Comparison of several acoustic modeling techniques and decoding algorithms for embedded speech recognition systems In IEEE Workshop on DSP in Mobile and vehicular systems, Nagoya, Japan, 2003. 61.Pascal Nocera, Georges Linarès, Dominique Massonié Phoneme Lattice Based A* Search Algorithm for Speech Recognition In Lecture Notes in Computer Science, International Conference on Speech, Text and Dialogue (ISCA), 2002. 62.Driss Matrouf, Olivier Bellot, Pascal Nocera, Georges Linarès, JF. Bonastre A Posteriori and a Priori Transformations for Speaker Adaptation in Large Vocabulary Speech Recognition Systems In European Conference on Speech Communication and Technology, Interspeech, Aalborg, Danemark, 2001. 63.Georges Linarès, Pascal Nocéra, H. Méloni Mixed Acoustic Events Classification using ICA and Subspace Classifier In IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP, Munich, Germany, 1997. 64.Georges Linarès, Pascal Nocéra, H. Méloni Model Breaking Detection using Independant Component Classifier In International Conference on Artificial neural networks, Lausanne, Switerland, 1997. Workshop 65. Mohamed Morchid and Georges Linarès : INEX 2012 Benchmark a Semantic Space for Tweets Contextualization. In CLEF (Online Working Notes/Labs/Workshop), 2012 66. Mickael Rouvier, Georges Linarès LIA @ MediaEval 2011: Compact representation of heterogeneous descriptors for video genre classification. Workshop MediaEval 2011, Pisa, Italy, 2011. 67. Mohamed Morchid, Georges Linarès MediaEval benchmark: Social Event Detection using LDA and external resources. Workshop MediaEval 2011, Pisa, Italy, 2011. Conférences nationales avec comité de lecture et publication des actes 68.Mohamed Morchid et Georges Linarès, «Prédiction des Buzz sur Twitter par analyse des contenus», CORIA 2013, Neuchatel, à paraître. 69.Mohamed Morchid, Richard Dufour, Georges Linarès, "LIA@inex2012 : Combinaison de thèmes latents pour la contextualisation de tweets". 13e Conférence Francophone sur l'extraction et la Gestion des Connaissances, 9 janvier - 01 février 2013, Toulouse, France. 70.Raphael Rubino, Stephane Huet, Fabrice Lefevre et Georges Linarès : Post-édition statistique pour l'adaptation aux domaines de spécialité en traduction automatique. In Traitement Automatique des Langues Naturelles, JEP/TALN 2012 AFCP, Grenoble, 2012. 71.Mohamed Morchid, Georges Linarès : Extraction de mots clefs dans des vidéos Web par Analyse Latente de Dirichlet In Journées d'étude de la parole, JEP 2012 AFCP, Grenoble, 2012. 72.Frederic Bechet, Remi Auguste, Stephane Ayache, Delphine Charlet, Geraldine Damnati, Benoit Favre, Corinne Fredouille, Christophe Levy, Georges Linarées, Jean Martinet : Percol0 - un système multimodal de détection de personnes dans des documents vidéos. In Journées d'étude de la parole, JEP 2012 AFCP, Grenoble, 2012. 18

73.Gregory Senay, Benjamin Lecouteux, Georges Linarès : Prédiction de l'indexabilité d'une transcription automatique. In Journées d'étude de la parole, JEP 2012 AFCP, Grenoble, 2012. 74.Fethi Bougarès, Yannick Estève, Paul Deleglise, Mickael Rouvier, Georges Linarès : Décodage guidé par sac de trigrammes. In Journées d'étude de la parole, JEP 2012 AFCP, Grenoble, 2012. 75.Raphael Rubino and Georges Linarès. Une approche multi-vue pour l'extraction terminologique bilingue. In Conference en Recherche d'information et Applications, CORIA, 2011, Avignon, 2011. 76.Raphael Rubino, I. Da Cunha Fanego, and G. Linarès. Une approche multi-vue pour l'extraction terminologique bilingue. In SEPLN Workshop on Iberian Cross-Language NLP tasks (ICL), Huelva, Spain, 2011. 77.Stanislas Oger, Mickael Rouvier, Georges Linarès Classification du genre vidéo reposant sur des transcriptions automatiques In Conference Traitement Automatique du Langage Naturel, TALN 2010, Montréal, Canada, 2010. 78.Stanislas Oger & Vladimir Popescu & Georges Linarès Modèles de langage probabilistes et possibilistes basés sur le Web In Journées d'études de la parole, JEP 2010, Mons, Belgique, 2010. 79.Mickael Rouvier, Georges Linarès, Driss Matrouf Identification à la volée du genre vidéo par combinaison de paramètres acoustiques In Journées d'études de la parole, JEP 2010, Mons 80.Gregory Senay, Georges Linarès, Benjamin Lecouteux, Stanislas Oger, Thierry Michel Décodage intéractif de la parole In Journées d'études de la parole, JEP 2010, Mons, Belgique, 2010. 81.Benjamin Lecouteux, Geoges Linarès, Benoit Favre Détection des mots hors vocabulaires par combinaison de mesures de confiances haut et bas niveaux In MajecSTIC, Avignon, France, 2009. 82.Mickael Rouvier, Georges Linarès, Driss Matrouf Identification robuste du genre vidéo par l'audio In MajecSTIC, 2009. 83.Hugo Mauchretien, Georges Linarès, Tania Jimenez, Corinne Fredouille Identification Musicale par des technologies de traitment automatique de la parole In MajecSTIC, 2009. 84.Loic Barrault, Driss Matrouf, Georges Linarès Combinaison de différents jeux de paramètres acoustiques pour la reconnaissance de la parole In Journées d'études de la Parole, JEP, Las Vegas, USA, 2008. 85.Vincent Jousse, Yannick Estéve, Fredé Béchet, Thierry Bazillon, Georges Linarès Caractérisation et détection de parole spontanée dans de larges collections de documents audio In Journées d'études de la Parole, JEP, Avignon, France, 2008. 86.Benjamin Lecouteux, Georges Linarès, Yannick Estève, Guillaume Gravier Combinaison de systèmes par décodage guidé In Journées d'études de la Parole, JEP, Las Vegas, USA, 2008. 87.Christophe Lévy, Georges Linarès, Jean-François Bonastre Adpatation rapide de modèles acoutisques compacts In Journées d'études de la Parole, JEP, Avignon, France, 2008. 88.Benjamin Lecouteux, Georges Linarès, Pascal Nocera, J-F Bonastre Reconnaissance de la parole guidée par des transcriptions approchées In Journées d'études de la Parole, JEP, Dinard, France, 2006. 89.Georges Linarès, Christophe Lévy, J-C Plagniol Estimation rapide de modèles semicontinus discriminants In Journées d'études de la Parole, JEP, Dinard, France, 2006. 90.Georges Linarès, Pascal Nocéra, Driss Matrouf, Frédéric Béchet, Dominique Massonié, Corinne Fredouille Le système de transcription du LIA pour ESTER-2005 In Workshop ESTER-2005, Avignon, 2005. 19

91.Georges Linarès J-F Bonastre Christophe Lévy Représentation acoustique compacte pour un système de reconnaissance de la parole embarquée In Journées d'études de la Parole, JEP, 2006. 92.Stanislas Oger, Georges Linarès, Frédéric Béchet Enrichissement dynamique du vocabulaire à partir du Web In Journées d'études de la Parole, JEP, Avignon, France, 2008. 93.Corinne Fredouille, Driss Matrouf, Georges Linarès, Pascal Nocera Segmentation en macro-classes acoustiques d émissions radiophoniques dans le cadre d ESTER In Journées d'études de la Parole, JEP, Fez, Maroc, 2004. 94.Georges Linarès, Christophe Lévy, J-C Plagniol Estimation rapide de modèles semicontinus discriminants In Journées d'études de la Parole, Nancy,France, 2004. 95.Christophe Lévy, Georges Linarès, Pascal Nocera, J-F Bonastre Reconnaissance de chiffres isolés embarquée dans un téléphone portable In Journées d'études de la Parole, JEP, Fez, Maroc, 2004. 96.Georges Linarès, Serigne Gueye, Loic Lefort, Pascal Nocera, Philippe Michelon Spécialisation automatique de modèles acoustiques In Journées d'études de la Parole, Nancy, France, 2002. 97.Pascal Nocera, Georges Linarès, Dominique Massonié Principes et performances du décodeur parole continue Speeral In Journées d'études de la Parole, JEP, 2002. 98.Georges Linarès, Pascal Nocéra, Henri Méloni, Stephane Igounet Adaptation au locuteur par conversion spectrales à l'aide de réseaux neuromimétiques In Journées d'études de la Parole, JEP, Avignon, France, 1996. Autres 99. Georges Linarès Reconnaissance de la parole et indexation audio Thesis for Habilitation à diriger les recherches, LIA, Université d'avignon et des Pays de Vaucluse, 2009. 100. Georges Linarès Automatic speech recognition: is this the end? In Keynote Speaker - Young researchers Workshop in Speech Technology, Dublin, Ireland, 2009. 101. Georges Linarès, «Classification automatique et détection de ruptures dans un environnement de bruits impulsifs», Thèse de doctorat, 1998, UAPV. Direction : Pascal Nocéra & Henri Méloni. 20