Le parlement Sami de Norvège a choisi Acapela Group pour développer la synthèse vocale en Sami.

Acapela Group - Actu

Le Sami est une langue parlée dans le nord de la Norvège, la Finlande et la Suède. Acapela va créer le Sami du Nord, le plus répandu, parlé par 20 000 personnes.

 

Une petite communauté pour les projets habituels de création de nouvelles langues en synthèse de la parole. Mais cette création du Sami est plus qu’un simple ajout d’une nouvelle langue à un portefeuille linguistique. Elle s’inscrit dans un projet culturel global  initié par Samintget pour  permettre à cette minorité linguistique de continuer à parler, enseigner et apprendre la langue. Assurer la pérennité du Sami en tant qu’héritage oral vivant, c’est ce qu’Acapela va contribuer à réaliser – avec d’autres ressources linguistiques et d’enseignement dédiés.

 

‘Nous sommes très heureux d’ajouter une voix de synthèse à nos ressources Sami’ a commenté Aili Keskitalo, le Président du Parlement Sami, ‘c’est un extraordinaire outil pour valoriser et promouvoir cette langue que ce soit pour lire, enseigner ou apprendre, mieux partager et transmettre les histoires de notre culture ou encore faire des annonces dans les lieux publics.  La synthèse vocale va permettre de lire n’importe quel contenu écrit en respectant parfaitement la grammaire et les spécificités de notre langue. Les contenus audio en Sami vont ainsi être accessibles à tous.’

 

Pour créer le Sami, Acapela utilise des bases de données et des lexiques existants fournis par Samintget et travaille en étroite collaboration avec ses linguistes. Toutes les données collectées depuis le début du projet en 2005 ont été utilisées pour créer les voix, féminine et masculine, qui seront disponibles en tant que voix ‘Colibri’, basées sur la technologie HMM.

 

Cette technologie permet de générer de la parole à partir de modèles statistiques où le spectre et la prosodie  sont modélisés ensemble. Cela ne demande aucun enregistrement spécifique ni recherche de speaker.  Si naturel de la voix peut être altéré par rapport à une voix HQ (Haute Qualité), le processus de création des voix ‘Colibri’ est plus simple, plus court, les voix sont flexibles avec une faible taille mémoire.

 

‘Les dernières innovations dans le domaine de la synthèse vocale et du traitement naturel de la parole (NLP) nous permettent maintenant d’utiliser des bases de données existantes pour créer de nouvelles langues et voix avec un résultat audio satisfaisant. Cela crée bien évidemment de nouvelles opportunités pour la synthèse telles que contribuer à la préservation de langues minoritaires avec des voix accessibles à tous.  Plus globalement, les voix ‘Colibri’ permettent de prendre en compte des  contraintes différentes et de répondre au marché avec une solution supplémentaire qui va profiter à de nouveaux usages et applications’ ajoute Lars-Erik Larsson, CEO d’Acapela Group.

 

Le projet est mené par Divvun et Giellatekno (Centre for Sami language technology at the University of Tromsø) et l’appel d‘offres a  désigné Acapela Group pour réaliser la synthèse de la parole en Sami du Nord. Le projet a démarré en novembre et le produit sera lancé en octobre 2014.