Outils personnels

Vous êtes ici : Accueil / PHC Utique franco-tunisien / Projets en cours / Conception et développement d'un environnement intégré de synthèse de parole arabe

Conception et développement d'un environnement intégré de synthèse de parole arabe

PHC : Utique
Codes du projet : 15G1405 -- Campus N° 32724VB
Domaine : Mathématiques - Sciences et technologies de l'information (STIC)
Intitulé : Conception et développement d'un environnement intégré de synthèse de parole arabe
Porteur(s) : COLOTTE Vincent, ELLOUZE Noureddine
Date de début : 01/01/2015
Date de fin : 31/12/2017

La synthèse de parole est de plus en plus utilisée dans les applications en ligne et les services multimédia, tels que les répondeurs automatiques, les bulletins de renseignements et les services d’assistance aux clients. Elle permet également de faciliter l’accès aux informations aux personnes handicapées et peut constituer un support éducatif innovant pour l’apprentissage des langues. De même les applications de la synthèse de parole en robotique sont très variées allant de la signalisation des alarmes jusqu’aux robots intelligents.
Toutefois, la synthèse de parole arabe n’a pas encore réussi à rattraper les progrès technologiques enregistrés dans ce domaine. Bien qu’il existe quelques systèmes de synthèse de parole arabe, la plupart d’entre eux sont la propriété de grandes firmes internationales et sont utilisés à des fins commerciales, tel que le système de synthèse de parole multilingue d’IBM [5]. D’autre part, la plupart de ces systèmes ne sont pas spécialement destinés pour la parole arabe, dans la mesure où ils font partie de systèmes multilingues, d’où ils ne prennent pas compte de la spécificité de cette langue et de ses différences dialectales.
En fait, le développement d’un système de synthèse de parole arabe est ralenti par l’indisponibilité de bases de parole arabe annotées, étiquetées et normalisées permettant aux chercheurs de disposer des
ressources suffisantes pour réaliser les opérations d’apprentissage, de test et de validation de leurs modèles et algorithmes.
C’est essentiellement dans le but de résoudre de tels problèmes que nous proposons ce projet de recherche qui se situe dans la continuation des travaux de recherche entamés depuis les années 1990 au Laboratoire Signal, Image et Technologies de l’Information, LSITI, à l’Ecole Nationale d’Ingénieurs de Tunis, ENIT,
dans le domaine de la synthèse de parole arabe, et plus particulièrement dans le cadre d’un projet qui vise
à élaborer un environnement intégré pour la synthèse de parole arabe.

Objectifs

Ces deux sujets de thèse de doctorat seront interdépendants, dans la mesure où la base de données de
parole arabe sera utile, d’une part, pour l’extraction des valeurs originales des paramètres prosodiques, i.e.
les durées des segments, les valeurs de fréquence fondamentale F0 et les valeurs d’intensité, et des
paramètres spectraux, tels que les paramètres MFCC, ainsi qu’à l’analyse des facteurs contextuels qui pourraient être mis en jeu dans la génération automatique de ces paramètres. D’autre part, cette base permettra de fournir les signaux vocaux nécessaires pour le module de synthèse, à différents niveaux, à savoir les phonèmes, les diphones et les syllabes.
Ainsi, les données fournies par le premier sujet seront la base sur laquelle le deuxième sujet sera développé. Toutefois, il n’est pas nécessaire d’attendre les résultats du premier pour pouvoir commencer à développer les modèles et les algorithmes du deuxième. Au contraire, ces deux travaux peuvent être menés en étroite collaboration, étant les deux constituants d’un environnement intégré de synthèse de parole, qui disposera d’une part d’un large dictionnaire de segments de parole et d’autre part des outils
nécessaires pour les utiliser pour la synthèse de parole.

Résultats

Informations supplémentaires

Ecole Nationale d’Ingénieurs de Tunis

Partenaire tunisien
Tunis
http://www.enit.rnu.tn/

Laboratoire(s) ou unité(s) de recherche
Laboratoire Signal, Image et Technologies de l’Information (LSITI)


Responsable(s)
Zied LACHIRI - LSITI - Tunis

Université de Lorraine

Partenaire français
Nancy
http://www.univ-lorraine.fr

Laboratoire(s) ou unité(s) de recherche
Laboratoire Lorrain en Informatique et ses applications (LORIA)


Responsable(s)
Vincent COLOTTE - LORIA - Nancy - Tél :0383593000 - Email :jean-yves.marion@loria.fr