Article contributeur

Données: parler en connaissance de cause ou se taire

La parole est d’argent, mais le silence est d’or. Voilà un proverbe millénaire qui ne se dément pas à l’ère de la voix sur IP et de l’internet des objets.

Nous passons un temps croissant à parler par l’intermédiaire de machines, et de plus en plus d’objets du quotidien sont à commande vocale. Partout où il y a un micro, il y a potentiellement écoute et enregistrement. Or, nous savons aujourd’hui que les données vocales contiennent des informations nombreuses et précieuses. Il est donc essentiel de s’informer et contrôler l’usage qui en est fait.

A l’instar du Swiss Screamscape, initiative artistique qui invitait en 2015 à laisser un cri sur un serveur vocal, le projet CoughVid porté par l’EPFL invite les citoyens à tousser au téléphone pour alimenter une base de données servant la recherche. Celle-ci permettra à un ordinateur de détecter, dans un avenir proche, un patient atteint de la COVID-19 au seul son de sa toux. C’est une très grande avancée qui permettrait de disposer d’un test rapide, pratique et peu invasif.

Car les données vocales recèlent des trésors de renseignements. «La voix porte beaucoup d’informations sur l’individu comme son âge, son sexe, ses origines, son éducation, ses ressentis, son état physique ou psychique voire même ses intentions» comme l’indique J.-F. Bonastre dans le Livre Blanc de la CNIL sur les assistants vocaux publié en septembre 2020. Toutes ces informations ne sont pas encore exploitables aisément mais le potentiel est bien là.

D’ailleurs, Michel Rochon, dans son livre «Le cerveau et la musique», évoque « des peuples qui communiquent, qui parlent par la musique ». Les langues sans mot, comme les langues musicales ou sifflées qui démontrent que les sons (l’intonation, le rythme…) peuvent contenir beaucoup de signification.

Outre la voix, il y a aussi le contenu des échanges et le sens des mots que l’on prononce. La valeur potentielle de nos conversations évolue très rapidement avec les progrès en matière d’interprétation et de traduction, à l’instar du nouveau modèle multilingue de Facebook AI qui ne passe plus par l’anglais comme langue pivot.

Qu’il s’agisse des propos ou du son de la voix, les conversations contiennent des données de grande valeur pour la recherche et le progrès technique. Evidemment, un autre aspect est celui de l’exploitation non contrôlée des données vocales. A l’heure actuelle, il n’est pas facile de les éviter car nous parlons de plus en plus à travers des machines (Skype, WhatsApp, Zoom …) ou avec des machines (assistants vocaux type Cortana, Siri ou Alexa…). Les conversations «en présentiel» sont également concernées puisque nous sommes entourés d’objets munis de micros (téléviseur, voiture, montre, réfrigérateur …).

Dans toutes ces situations, les propos peuvent être écoutés, interprétés, retranscrits ou enregistrés par des humains ou d’autres machines, en direct ou en différé, avec ou sans consentement et à des fins qui ne sont pas toujours explicites. Profils, émotions, voire intentions peuvent également être déduits de la voix. Il est donc important, quel que soit le contexte (professionnel, individuel, scolaire …) de parler en connaissance de cause, ou préférer se taire.


Commentaires

Nathalie Feingold

NPBA Fondatrice