Interface vocale : Siri vulgarise, le Cloud soutient la technologie
L’éditeur Nuance a partagé avec LeMagIT sa vision du marché de la reconnaissance vocale et commenté "l’effet Siri" sur le segment. Si l’outil d’Apple a contribué à décloisonner les usages, les technologies comme le cloud ont quant à elles permis des traitements complexes depuis les terminaux mobiles.
Les interfaces vocales ont-elles profité de l’élan Siri ? C’est l'une des questions que l’on peut se poser à la suite de la visite de l’événement Dragon Life, organisé par l’éditeur Nuance, spécialisé dans le segment de la reconnaissance vocale, qui s’est tenue la semaine dernière, à Paris. Si le phénomène de la reconnaissance vocale et des interfaces contrôlées par la voix n’est certes pas nouveau, force est de reconnaître que le concept a pris une place plus importante dans les technologies du IT. Si le module Siri popularisé par l’iPhone 4s fait office de levier n°1, l’omni-présence du contrôle vocal dans Android en est un autre. Autre exemple, l’intégration en natif de la dictée vocale dans le dernier OS d’Apple, Mountain Lion. Simple effet de mode ou maturité des interfaces vocales ?
«Chez Nuance, on parle de l’effet Siri. Dès que Siri est sorti, les demandes en matière d’interfaces vocales ont monté en flèche. De plus en plus d’entreprises ont pris en compte que l’intégration des technologies vocales dans leurs produits et dans leurs applications était certes amusante mais pouvait surtout cibler la productivité de leurs clients», réagit Vanessa Richter, porte-parole de Nuance présente sur Dragon Life. Selon elle, l’industrie de la reconnaissance vocale profite ainsi de l’effet Siri et indirectement «de toute la machine marketing mise en place par Apple». Surtout poursuit-elle, son intégration dans un terminal mobile a contribué à faciliter son utilisation.
La prolifération des terminaux mobiles et le taux de pénétration d’Android et d’iOS ont ainsi placé entre de nombreuses mains des brides de reconnaissance vocale, contribuant à leur vulgarisation et à leur appropriation par le grand public - et indirectement par les éditeurs et constructeurs. «Le hype provoqué par Apple donne envie aux autres sociétés de l’intégrer dans leurs produits. On note beaucoup plus de demande, surtout en ce moment, sur les segments de l’automobile et de la TV connecté (Samsung, Panasonic).»
Lors de son événement, Nuance a ainsi mis en scène plusieurs cas d’usage (embarqué et sur le desktop). De la cafetière commandée à la voix, en passant par la TV pilotée par une télécommande vocale, jusqu’à la premier auto à supporter la dictée vocale (une BMW série 7 - en photo ci-dessous). Sans oublier le logiciel phare de l’éditeur, Dragon Naturally Speaking ainsi que l’application mobile Dragon Dictate.
Le Cloud, la clé des traitements
Mais la mobilité n’est pas le seul catalyseur de la reconnaissance vocale. L’intégration grandissante des technologies vocales est également liée à une amélioration de la technologie de traitement des données. Comprendre le Cloud. Car si les terminaux mobiles favorisent l’usage, leurs ressources limitées rendent presque impossible un traitement en local. Les infrastructures distribuées dans les nuages prennent ainsi le relai.
«Aujourd’hui, nombre d’opérations prises en compte par les outils Nuance sont gérées dans le Cloud. On peut collecter et traiter davantage de données pour améliorer les processus de reconnaissance vocale», explique Nuance. Ainsi avec l’application iPhone Dragon Dictate, par exemple, chaque phrase ou mot prononcé est traité sur les serveurs distants de Nuance et retourné sur le terminal mobile. Le fonctionnement est d’ailleurs identique dans la BMW série 7 équipée de la dictée vocale - l’auto est équipée d’une carte SIM pour gérer les connexions aux réseaux mobiles.
Cette approche a notamment permis d’accélérer l’adoption de la reconnaissance vocale sur le segment de la santé. Un secteur sur lequel est implanté Nuance depuis le rachat de Philips Speech Recognition Systems. L’éditeur propose aujourd’hui une application baptisée Dragon Medical. L’idée, explique Anne Durand-Badel, directrice marketing des activités santé de Nuance, est de fluidifier le cheminement de l’information en accélérant la transcription de compte rendu, la dictée, la création de rapports ainsi que les prescriptions en volume. Un bienfait selon elle avec la hausse des travaux administratifs due au dossier patient dans les hôpitaux.
La solution de Nuance s’implémente ainsi dans un environnement Cloud, tant privé que public - selon la politique des centres hospitaliers. Le traitement de la voix et des données est réalisé dans un data center qui héberge la connaissance métier. Lors d’une démonstration, une prescription est dictée à la voix à partir d’une application sur tablette et les champs d’un formulaire sont remplis automatiquement. Le traitement est réalisé en temps réel.
Une multiplication des cas d’usage donc. Mais pouvons-nous pour autant parler de démocratisation ? Non, estime Francoise Mohymont une représentante technique de Nuance, en pleine présentation de Dragon Naturally Speaking. «ll est certain que l’on constate aujourd’hui un intérêt plus élevé. Mais la technologie ne coûte pas moins chère. Les prix restent stables.» La démocratisation par les prix devra donc être alors la prochaine étape.