« Atos Origin optimise la reconnaissance vocale grâce à son système de filtrage anti-bruit »

Paris, le 11 juin 2002

Atos Origin lance un nouveau composant logiciel qui renforce la qualité des services téléphoniques en reconnaissance vocale, par élimination des signaux dépourvus de composantes voisées (issues de la voix) : le VSAD* (Voiced Signal Activity Detector).

La plupart des solutions actuelles de reconnaissance vocale sont activées par le niveau du signal capté par le téléphone, sans distinction préalable entre les signaux utiles (parole) et d'éventuels bruits ambiants. Il s'ensuit un coût de fonctionnement plus élevé et des perturbations pour l'utilisateur.

Afin de pallier ces déficiences, le département Recherche & Développement de l'activité Multimédia d'Atos Origin a développé le VSAD : ce composant logiciel, en détectant les parties du signal qui sont dépourvues de composantes voisées, permet de filtrer une bonne partie des bruits parasites (souffle, éternuements, toux, craquements et autres bruits ambiants…). Ce système renforce la performance des services téléphoniques en reconnaissance vocale, particulièrement lorsqu'ils sont consultés en situation de grande mobilité ou dans des environnements sonores très pollués (lieux publics, transports, chantiers...).

Services rendus :

> Le VSAD sélectionne la voix et élimine les bruits parasites.
Seuls les signaux utiles (contenant de la parole) sont soumis au système de reconnaissance vocale. Lorsqu'un signal dépourvu de composantes voisées est identifié, il est directement éliminé. Techniquement, le VSAD détecte, dans le signal, les fréquences (pitch*) correspondant aux vibrations des cordes vocales humaines.

> Barge-in* " intelligent "
Le barge-in est la fonction qui permet à l'utilisateur de " couper la parole " au service téléphonique vocal. Sans VSAD, de nombreux bruits ambiants se révélaient susceptibles de perturber le dialogue en causant l'interruption intempestive des messages émis par le serveur vocal. Grâce au VSAD, seuls les signaux voisés sont pris en compte par le barge-in, garantissant un confort d'utilisation inégalé.

> Le VSAD adapte le système de reconnaissance vocale au niveau sonore ambiant.
Alors que les VAD* traditionnels sont rapidement mis en défaut par un signal sonore surchargé, le VSAD améliore la qualité du service en s'adaptant à des rapports signal à bruit très médiocres (inférieurs à une dizaine de décibels). Ce niveau correspond à l'utilisation d'un service vocal en voiture, fenêtres ouvertes et sur autoroute, ou à une personne murmurant au téléphone.

Le VSAD, un composant logiciel indépendant

Développé par Atos Origin, le VSAD est indépendant des moteurs de reconnaissance vocale. Installé sur les frontaux du serveur vocal, sa consommation de ressources s'avère négligeable, en particulier grâce à la mise en oeuvre des fonctions MMX des processeurs de type Pentium©.

Avantages fonctionnels et économiques :

  • Le filtrage des bruits parasites minimise le volume des données soumises au système de reconnaissance vocale. Une meilleure qualité de service est garantie par la réduction des interruptions du dialogue indûment causées par des bruits parasites. De plus, certains dysfonctionnements induits par l'interprétation erronée de bruits parasites sont éliminés.
  • Les coûts de production sont optimisés par la diminution du nombre de ressources de reconnaissance vocale nécessaires, puisque ces dernières ne sont désormais sollicitées qu'à bon escient.

Mots clefs :
VSAD : Voiced Signal Activity Detector.
VAD : Voice Activity Detector (simple détecteur d'énergie sonore).
Pitch : Fréquence de vibration (en l'occurence, des cordes vocales humaines).
Barge-in : Capacité d'interruption des messages émis par le serveur vocal.
MMX : MultiMédia eXtension (Intel©).

A propos d'Atos Origin
Atos Origin est l'un des principaux acteurs dans les domaines des services informatiques et du e-business. Sa mission est de traduire la vision stratégique de ses clients en résultats par une meilleure utilisation de solutions de conseil, intégration, e-business et d'infogérance. Implanté dans une trentaine de pays à travers le monde, Atos Origin réalise un chiffre d'affaires annuel de 3 milliards d'euros avec un effectif de plus de 26 000 personnes. Le groupe compte parmi ses clients ABN-Amro, Alstom, BNP Paribas, Euronext, FIAT, ICI, KPN, Lucent, Philips, Renault, Saudi Aramco, Shell, Unilever, Vivendi Universal et Wolters Kluwer.

Expert en technologies vocales
Dès 1988, l'Activité Multimédia d'Atos Origin a développé son expertise des services vocaux interactifs. Celle-ci repose sur une plate-forme multimédia industrielle, ouverte à des modules logiciels tiers tels que les moteurs de reconnaissance ou de synthèse vocale. Au delà du VSAD*, les compétences d'Atos Origin en technologies vocales s'étendent à la synthèse vocale, au VoiceXML, à l'authentification par empreinte vocale, aux centres de contacts multimédias (ACD virtuel, CTI), et, grâce à son investissement en Recherche & Développement, à l'ensemble des technologies vocales émergentes.

Contact Presse Atos Origin:
Anne de Beaumont
+ 33 (1) 49 00 96 42
anne.debeaumont@atosorigin.com