On n'en est qu’au début et le grand public en est déjà friand : la technologie vocale explore de nouveaux territoires. Pour le contexte professionnel, cette technologie comprend deux aspects : la commande vocale et la reconnaissance vocale. Quels sont les secrets de leur fonctionnement ? A quels usages se destinent-elles déjà ?
Sommaire du dossier :
- Les promesses des technologies vocales
- Reconnaissance automatique de la parole : tout commence par la voix
- La dictée vocale au secours des services sociaux
- Le CD63 adopte la transcription multivocale pour les élus
- Thibault Duchemin : "Avec Ava, nous préparons le futur"
A l’horizon 2020, 50 % des recherches seront réalisées par la voix plutôt que par le traditionnel champ de requête. Plus besoin de saisir des mots sur un moteur de recherche, il suffira de parler! Depuis quelques mois déjà, près de 20 % des internautes utilisent la recherche vocale sur leur téléphone. C’est notamment le cas des plus jeunes : 46 % de la tranche 16-34 ans dictent désormais leurs requêtes.
>Lire aussi : Trois applications gratuites pour retranscrire automatiquement vos fichiers audio
Siri, Cortana, Alexa, Google Assistant… En quelques mois, ces assistants vocaux sont devenus d’incontournables outils pour de nombreux utilisateurs. Non seulement, ils permettent d’effectuer des recherches sur la toile, mais ils sont également capables d’allumer la lumière, de passer une commande chez un commerçant ou de lancer un morceau de musique.
C’est peu dire que les technologies vocales ont le vent en poupe. De nombreux atouts jouent en leur faveur. A commencer par la rapidité de l’expression orale : il est en effet possible d’exprimer jusqu’à 200 mots par minute à l’oral, contre 70 en saisie clavier et une trentaine par l'écriture manuscrite. Par ailleurs, l’expression orale libère l’internaute : celui-ci peut envoyer des ordres tout en faisant du vélo ou en cuisinant.
Parlez, Salesforce vous écoute
Si le grand public s’empare avec gourmandise de ces technologies vocales, les entreprises s’y mettent avec plus de circonspection. Mais elles ne devraient pas tarder à s’engouffrer dans la brèche. Notamment celles qui sont en relation directe avec le client final. Selon une étude réalisée pour le compte de la société Pindrop, 94 % des managers estiment que les technologies vocales constituent “un levier essentiel de satisfaction client”. Et plus de la moitié (57 %) estiment qu’elles vont réduire le coût de la transaction client.
Pour les acteurs du marché, le doute n’est plus permis : “Alors que nous sommes habitués à l’utilisation de pavés tactiles et de claviers, la technologie vocale sera le moteur dominant pour transformer les vies et les entreprises”, explique Vijay Balasubramaniyan cofondateur de la société Pindrop.
Dans l’univers du logiciel professionnel, les initiatives se multiplient également. A commencer par la célèbre solution CRM (gestion de la relation client) Salesforce qui vient d’annoncer la sortie d’un assistant dédié à la conversation. Baptisé Einstein Voice, il permet aux utilisateurs de communiquer oralement avec le logiciel et de réaliser certaines tâches comme la saisie de données ou la dictée de notes. Capable de comprendre une série de mots associés comme “le mois prochain”, il pensera à rappeler un rendez-vous au moment opportun.
Si Salesforce prend le tournant de la technologie vocale, c’est qu’il n’a plus vraiment le choix : “Nous sommes au coeur d’un changement technologique incroyable où la puissance de la voix change fondamentalement notre façon de travailler”, constate Parker Harris le cofondateur de Salesforce ; “Einstein Voice inaugure une nouvelle ère du CRM conversationnel et offre de nouvelles perspectives de productivité”.
La documentation médicale en mode vocal
Les métiers de l’information-documentation commencent également à utiliser la technologie vocale. Et c’est probablement dans le secteur médical que l’on trouve les solutions les plus opérationnelles. Les éditeurs Dicma et Winscribe proposent une reconnaissance vocale plus particulièrement destinée aux acteurs de la santé. Celle-ci embarque tout ce qu’il faut pour leur faire gagner du temps : reconnaissance vocale pour l’ensemble des applications métier, dictionnaires médicaux enrichis à partir du corpus de l’établissement de santé, évaluation de la fiabilité de la reconnaissance vocale à partir de statistiques, etc.
Concrètement, un texte dicté par un médecin peut être intégré dans un système de gestion documentaire de dictée, puis envoyé au secrétariat médical pour correction et validation. Pour plus de sécurité, le texte et le fichier audio restent associés. Ce même texte dicté peut également être injecté dans une application métier : “On parle de reconnaissance vocale au curseur. Autonome, en temps réel, elle s’utilise directement dans les DPI (dossier patient informatisé), PACS (système d’archivage et de partage d’images) ou RIS (système d’information radiologique) du marché”, explique l’éditeur.
Ce n’est pas tout. Grâce à la reconnaissance vocale, le fichier vient ensuite s’insérer dans un vaste ensemble de gestion documentaire : transcription du document par les secrétaires médicales, signature électronique des rapports par le médecin, partage des documents avec d’autres collaborateurs, archivage des rapports sur des serveurs sécurisés. Depuis la création du document en mode vocal jusqu’à l’archivage électronique, la boucle documentaire est ainsi bouclée.
La sécurité des données, seul frein à l’expansion des technologies vocales
De toute évidence, le marché des technologies vocales fait saliver bien des entreprises. Google, Amazon, Apple, Microsoft occupent déjà le terrain grand public avec leurs enceintes connectées à commande vocale. Ce marché devrait dépasser les 2,5 milliards d’euros en 2021 ; il dépassait difficilement les 300 millions d’euros en 2015… Les éditeurs spécialisés dans les solutions professionnelles ont également investi le terrain et s’emploient à convertir au-delà du secteur médical.
Seule ombre au tableau : les craintes en matière de sécurité. Les individus et les entreprises qui sont attachés à la confidentialité de leurs données n’hésitent pas à exprimer leur préoccupation. 82 % des entreprises prévoient des réticences de la part de leurs clients. Les éditeurs vont devoir redoubler d’inventivité pour apporter des réponses aux craintes des usagers.
La reconnaissance vocale, terre de conquête pour les start-up françaises
Il n’y a pas que Siri, Alexa ou Cortana dans la vie. Plusieurs jeunes pousses françaises investissent le marché des technologies vocales et commencent à se faire une réputation. A commencer par Ava qui développe des applications plus particulièrement destinées aux sourds et aux malentendants. Un étudiant souffrant de dysfonctionnement auditif peut par exemple assister à un cours en amphithéâtre et lire la transcription des paroles du professeur sur son téléphone. Plus pratique que la lecture sur les lèvres... L’outil peut bien évidemment être déployé au sein des entreprises qui souhaitent intégrer des personnes malentendantes.
Autre entreprise du secteur, Snips développe un assistant vocal qui peut être connecté à n’importe quel objet connecté. Jusqu’ici, rien de nouveau. Mais la start-up fait une promesse : les données de l’utilisateur ne sont pas communiquées à Google, Amazon ou Microsoft. La voix n’est en effet pas propulsée dans le cloud, mais sanctuarisée dans Snips.
Quant à xBrain, éditeur de logiciel spécialisé dans la compréhension du langage naturel, il propose une technologie permettant à l’automobiliste de rédiger des courriels ou des SMS tout en conduisant. Ses solutions s’adaptent également aux environnements de commerce électronique, de la banque et de l’assurance.