COMPTE RENDU DE REUNION Réf. TBR/TSI/LMM/PG,01/062/CRR Le : 8 Juin 2001 Rédacteur : Philippe Gournay Affaire : SYMPATEX Date de la réunion : Objet de la réunion : Compte-rendu de la cinquième réunion d avancement Participants Service ou Firme Visa 6 Juin 2001 Lieu : THALES Communications 66, rue du fossé blanc BP 156 92231 GENNEVILLIERS CEDEX Diffusion Pierre-Yves LE MEUR Gérard CHOLLET* Dijana PETROVSKA Geneviève BAUDOIN* Petr NEPUSTIL Fadi EL CHAMI Thierry ANDRÉ* Bernard GIMEL Philippe GOURNAY* Christophe BAVEREL Gilles MALHERBE Xavier RODET* Diemo SCHWARZ *Destinataires du compte rendu. Merci de transmettre une copie de ce document aux autres membres du service ou de la firme. ORDRE DU JOUR ELAN Informat. ENST Paris ENST Paris ESIEE ESIEE ESIEE IRIUS Tech. IRIUS Tech. /TBR/TSI /TBR/TSI /TBR/TSI IRCAM IRCAM Participants* + : Jacques TOËN* ELAN Inform. Frédéric CHARTIER TBR/TSI Nathalie CARVES-B. TBR/TSI 1. Accueil et Introduction. 2. Aspects administratifs. 3. Bilan des actions en cours (sous-projets 2 et 3). 4. Présentations et démonstrations. 5. Préparation du travail à effectuer. 6. Bilan de la réunion. DOCUMENTS JOINTS AU CR * 1. Liste et coordonnées des participants à cette réunion d'avancement. 2. Copie des planches présentées lors de la réunion. 3. Copie de la note d'irius sur «l'analyse de la situation du marché de la radiomessagerie» 4. Copie de la présentation de l'esiee «Segmental speech coding at very low bit rate» 5. Copie de la présentation de l'esiee «Synthèse par sélection dynamique des unités» 6. Copie de la présentation de l'enst «Du codage par indexation vers la vérification de locuteur» 7. Copie de la présentation de l'ircam intitulée «The Caterpillar System for Concatenative Sound Synthesis by Unit Selection» *hors pages de suite "Action" ou "Texte" Page 1/7 CR 01 Cette page est la page de garde du compte-rendu. Elle doit être suivie de m pages "Action" réf. CR 02 et éventuellement de n pages "Texte" réf..
N Action Responsable Délai 27 Être dépositaire du code source de référence de l'analyse/synthèse HNM (langage C) : Centraliser les corrections / améliorations ; Informer les partenaires des évolutions ; Mettre le code source modifié à disposition des partenaires. 28 Envoyer à ELAN la liste des corrections / améliorations apportées au code source de l'analyse/synthèse HNM en C (code source modifié + description des modifications). ELAN TOUS Aucun ASAP Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 2/7 CR 02 Cette page est toujours précédée de la "Page de garde" réf. CR 01. Elle peut être accompagnée de n pages "Texte" réf..
1 Accueil et Introduction Merci à l'ensemble des partenaires d'avoir bien voulu se déplacer sur le site de THALES Communications à Gennevilliers pour cette cinquième réunion d'avancement du projet RNRT SYMPATEX. Circulation d'une liste des coordonnées des participants à la réunion (donnée en annexe 1 - les coordonnées des personnes ayant participé à la réunion de lancement ou à l'une des trois réunions d'avancement précédentes ne sont pas nécessairement rappelées). Présentation de l'ordre du jour (une copie des planches présentées lors de la réunion est donnée en annexe 2). 2 Aspects administratifs IRIUS nous fait part des éléments suivants : Problèmes de facturation : Suite à une réorganisation à la fin de l'année 2000, la participation au projet SYMPATEX du groupe INFO Réalité a été transférée de la société INFO Télécom vers la société IRIUS Technologies (toutes deux filiales du groupe INFO). IRIUS a complété un dossier de transfert de responsabilité auprès du Ministère, ce transfert est donc effectif depuis le 25 Janvier 2001. IRIUS nous informe que, depuis le démarrage du projet, INFO Réalité puis IRIUS n'ont perçu aucune subvention de la part du Ministère. IRIUS souhaite que cette situation soit débloquée rapidement, faute de quoi leur participation au projet pourrait être remise en cause. Note : Suite à cette réunion, nous avons contacté le secrétariat du MENRT (Mme R. DUCOEUR) qui nous a indiqué la procédure suivante : IRIUS Technologies doit envoyer les factures d'info Réalité puis d'irius Technologies, accompagnées des justificatifs demandés (justificatifs de dépenses, fiche d'étape). Un échéancier prévisionnel est donné dans la décision d'aide n 99 S 0467. Pour la période incluant le 25 Janvier 2001, deux factures doivent être émises : l'une au nom d'info Télécom pour la période précédent le 25 Janvier, l'autre au nom d'irius pour la période suivant le 25 Janvier. Restructuration du groupe INFO : Pour faire face à une conjoncture difficile, le groupe INFO souhaite simplifier sa structure (43 filiales). La nouvelle organisation du groupe INFO pourrait être décidée aux alentours du 15 Juillet, ou au plus tard en Septembre 2001. La responsabilité de la participation au projet SYMPATEX risque donc à nouveau d'être transférée à l'intérieur du groupe INFO. Analyse du marché : La dernière étude de marché conduite par IRIUS sur la radiomessagerie vocale s'avère plutôt pessimiste (voir paragraphe 3.1). IRIUS s'interroge sur l'intérêt de réaliser le démonstrateur tel qu'il a été défini lors du montage du projet. Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 3/7
3 Bilan des actions en cours (sous-projets 1, 2 et 3) Sous-projet 1 : Analyse du marché IRIUS Technologies présente les résultats de sa dernière analyse du marché dans le domaine de la radiomessagerie vocale (voir document en annexe 3). Cette étude montre que le marché de la radiomessagerie vocale s'est très fortement marginalisé depuis le lancement du projet SYMPATEX : en 1999, le nombre d'usager de la radiomessagerie en France était de 2.5 millions et le marché était encore en croissance ; en 2001, il n'est plus que de 400 000. Au niveau mondial, les espérances ne se sont pas confirmées (stagnation du marché, qui est maintenant surtout caractérisé par une forte tendance à la baisse du prix unitaire des pagers). Les pays en voie de développement continuent de manifester un très grand intérêt objectif, mais ils cherchent surtout des solutions totalement "clé en mains" (incluant le financement, le support technique sur une longue période, etc., et parfois même la restauration d'une infrastructure FM défectueuse). Dans de telles conditions, IRIUS n'envisage plus de déployer un nouveau système de compression de la parole. Si les offres en cours se concrétisent par des déploiements, c est dans un premier temps la technologie actuelle HSX - compression de la voix à 1200bits/s qui sera déployée. Les partenaires restent convaincus qu'il existe de nombreux champs d'application pour la technique de codage développée dans le cadre du projet (livres lus sur CD-ROM, MPEG-4, multicast, voice XML - voir C.R. de la précédente réunion d'avancement). Une fois de plus, les partenaires qui le souhaitent sont invités à soumettre leur contribution à la rédaction du document sur l'analyse du besoin. Sous-projet 2 : Amélioration de la qualité de la parole en monolocuteur Présentation des travaux menés par l'esiee (Petr NEPUSTIL) pour améliorer la qualité de la parole en codage monolocuteur : remplacement de la synthèse LPC par une synthèse MBROLA dans le codeur existant ; codage de la prosodie. Copie des planches de la présentation et fichiers audio de démonstration en annexe 4. Tâche 2.4 : Extension vers la synthèse à partir du texte ELAN a fait enregistrer en studio la quantité de parole prévue par l'action 23 (voir compte rendu de la réunion précédente). ELAN est actuellement en attente de livraison de cette base de données par le studio. Note : ELAN prévoyait initialement de diffuser cette base de données et sa transcription phonétique avant le 15 juin. Depuis, ELAN a refusé l'enregistrement livré par le studio, car le signal était "coupé trop court". ELAN devrait recevoir un signal très propre et "bien découpé" vers le 6 juillet. Pour tenir compte des congés d'été et du délai nécessaire pour transcrire phonétiquement et formater la BDD SYMPATEX, sa date de livraison à tous les partenaires a été repoussée au 31 juillet. D'ici cette date, les partenaires peuvent contacter Carine Jobin (mailto:cjobin@elan.fr), qui est chargée de ce travail (messagerie P.Y. Le Meur, datée du 20/06/01). Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 4/7
ELAN confirme le fait que son nouveau synthétiseur basé sur HNM délivre une qualité au moins équivalente à celle de l'ancienne génération basée sur PSOLA. Le nouveau synthétiseur présente une plus grande souplesse, ainsi qu'une meilleure qualité en cas de ralentissement temporel. Dans le futur, il devrait permettre des modifications du timbre de la voix (dans le cas du synthétiseur PSOLA, il était nécessaire d'enregistrer une nouvelle base de donnée pour chaque locuteur). ELAN accepte d'être dépositaire du code de référence de l'analyse/synthèse HNM (langage C) : Il s'agit de centraliser les corrections / améliorations apportées par les différents partenaires au code source d'origine ; d'informer les partenaires des évolutions successives ; de mettre le code source modifié à disposition des partenaires qui le demandent. Les partenaires qui souhaitent contribuer à l'évolution de ce code source de référence sont priés d'envoyer le code source des fonctions modifiées, ainsi qu'une description de la modification, à ELAN (P.Y. LE MEUR). Action 14 : Synthèse par sélection dynamique des unités Présentation par l'esiee d'une nouvelle méthode de sélection des unités de synthèse (représentants). Le nombre de représentants par classe acoustique est variable. Les représentants sont sélectionnés par quantification vectorielle en tenant compte des paramètres prosodiques. Cette méthode donne de très bons résultats en terme de qualité de la synthèse (concaténation des unités beaucoup plus douce). Copie des planches de la présentation et fichiers audio de démonstration en annexe 5. Sous-projet 3 : Divers : Extension vers la vérification du locuteur Présentation des travaux menés par l'enst (Dijana PETROVSKA) sur les possibilités de combiner la vérification du locuteur et le codage par indexation d'unités : il est possible d'utiliser les meilleurs représentants sélectionnés par le codeur pour identifier un locuteur. Pour l'adaptation du locuteur, on peut imaginer la procédure suivante : vérification du locuteur pour identifier le locuteur le plus proche dans une base d'apprentissage multilocuteur, puis codage monolocuteur avec transformation du locuteur. Copie des planches de la présentation en annexe 6. Divers : Présentation par Xavier RODET et Diemo SCHWARZ des travaux menés par l'ircam sur la synthèse de sons musicaux par sélection d'unités (copie des planches avec démonstration audio en annexe 7). Même si le domaine d'application est très différent, l'idée de base est la même et certains problèmes à surmonter sont communs. Les partenaires de SYMPATEX souhaitent continuer les échanges avec l'ircam, par exemple sous la forme d'une participation aux réunions d'avancement. 27 28 Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 5/7
4 Plan de travail pour les mois à venir Liste des problèmes techniques à résoudre Avant de clore cette réunion, nous avons dressé une liste des principaux problèmes techniques auxquels les partenaires sont actuellement confrontés. Nous avons également proposé quelques solutions à étudier. Les partenaires sont invités à réfléchir à ces problèmes et à soumettre toute autre idée de solution. Problèmes de concordance de voisement entre les segments à coder et les unités de synthèse : Les solutions évoquées sont : Introduire des contraintes lors du calcul de la DTW. Utiliser un modèle qui ne comporte qu'une seule information spectrale. Mise en œ uvre des techniques de transformation du locuteur : Il reste à résoudre les problèmes suivants : Choix et nombre de locuteurs canoniques? Estimer une matrice de transformation par classe d'unités? Revue de projet : On rappelle que la seconde revue de projet devant le Ministère doit avoir lieu en Novembre, donc peu de temps après notre prochaine réunion d'avancement. Les partenaires qui souhaitent apporter une contribution à la rédaction du rapport annuel peuvent le faire dès maintenant. 5 Bilan de la réunion Une revue des actions décidées a été effectuée en fin de réunion (voir tableau des actions en page 2). La prochaine réunion se tiendra Mercredi 10 Septembre 2001, de 10H00 à 16H30, dans les locaux de l'enst Paris, 46 rue Barrault, Paris 13ème. Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 6/7
N Action SUIVI DES S Responsable Délai 3 Etudier le portage des logiciels de codage monolocuteur de Linux vers PC Windows avec Visual C++ 6.0 : Diffuser un CD-ROM pour le codage monolocuteur sur PC Windows 95/98/NT. Ajouter les logiciels de codage de la prosodie. Fait partiellem. le 8/03/01 22 Faire la mise à jour avec ELAN du code source en C pour HNM Fait 23 Enregistrement d'une base de données monolocuteur (voix de femme, français) pour la synthèse à partir du texte et le codage SYMPATEX 24 Inviter M. Xavier RODET (IRCAM) à participer à notre prochaine réunion d'avancement SYMPATEX 25 Faire des copies du CD-ROM de N. Paulsson (logiciels MATLAB pour HNM) et les diffuser auprès de ELAN, ENST, ESIEE et 26 Contacter Gérard Bailly à l'icp (Institut de la Communication Parlée) pour tenter de récupérer un enregistrement de la base de données de phrases sémantiquement imprédictibles ELAN Prévu pour le 15 Juin Fait Fait Sans réponse - Abandon Compte rendu de réunion Réf. TBR/TSI/LMM/PG,01/062/CRR Page 7/7 CR Cette page est toujours précédée de la "Page de garde" réf. CR 01 et de m pages "Action" réf.