La voix recèle des trésors d'informations

NPBA - Fondatrice

01 décembre 2020, 19h00

Nous passons un temps croissant à parler par l’intermédiaire de machines, et de plus en plus d’objets du quotidien sont à commande vocale. Partout où il y a un micro, il y a potentiellement écoute et enregistrement. Or, nous savons aujourd’hui que les données vocales contiennent des informations nombreuses et précieuses. Il est donc essentiel de s’informer et contrôler l’usage qui en est fait.

A l’instar du Swiss Screamscape, initiative artistique qui invitait en 2015 à laisser un cri sur un serveur vocal, le projet CoughVid porté par l’EPFL invite les citoyens à tousser au téléphone pour alimenter une base de données servant la recherche. Celle-ci permettra à un ordinateur de détecter, dans un avenir proche, un patient atteint de la COVID-19 au seul son de sa toux. C’est une très grande avancée qui permettrait de disposer d’un test rapide, pratique et peu invasif.

Car les données vocales recèlent des trésors de renseignements. «La voix porte beaucoup d’informations sur l’individu comme son âge, son sexe, ses origines, son éducation, ses ressentis, son état physique ou psychique voire même ses intentions» comme l’indique J.-F. Bonastre dans le Livre Blanc de la CNIL sur les assistants vocaux publié en septembre 2020. Toutes ces informations ne sont pas encore exploitables aisément mais le potentiel est bien là.

D’ailleurs, Michel Rochon, dans son livre «Le cerveau et la musique», évoque « des peuples qui communiquent, qui parlent par la musique ». Les langues sans mot, comme les langues musicales ou sifflées qui démontrent que les sons (l’intonation, le rythme…) peuvent contenir beaucoup de signification.

Outre la voix, il y a aussi le contenu des échanges et le sens des mots que l’on prononce. La valeur potentielle de nos conversations évolue très rapidement avec les progrès en matière d’interprétation et de traduction, à l’instar du nouveau modèle multilingue de Facebook AI qui ne passe plus par l’anglais comme langue pivot.

Qu’il s’agisse des propos ou du son de la voix, les conversations contiennent des données de grande valeur pour la recherche et le progrès technique. Evidemment, un autre aspect est celui de l’exploitation non contrôlée des données vocales. A l’heure actuelle, il n’est pas facile de les éviter car nous parlons de plus en plus à travers des machines (Skype, WhatsApp, Zoom …) ou avec des machines (assistants vocaux type Cortana, Siri ou Alexa…). Les conversations «en présentiel» sont également concernées puisque nous sommes entourés d’objets munis de micros (téléviseur, voiture, montre, réfrigérateur …).

Dans toutes ces situations, les propos peuvent être écoutés, interprétés, retranscrits ou enregistrés par des humains ou d’autres machines, en direct ou en différé, avec ou sans consentement et à des fins qui ne sont pas toujours explicites. Profils, émotions, voire intentions peuvent également être déduits de la voix. Il est donc important, quel que soit le contexte (professionnel, individuel, scolaire …) de parler en connaissance de cause, ou préférer se taire.

Données: parler en connaissance de cause ou se taire

Le curieux dynamisme du marché du travail

Oncle Sam fait ses emplettes en Helvétie

Entreprises recherchent personnel désespérément

Comptabilité opaque ou les finances confuses de l’armée

Multimédia