Au-delà des octets
Assistants vocaux : une avancée positive ou perverse ?

Avant tout, je dois vous demander de ne pas attendre de ma part une analyse impartiale des assistants vocaux. Alexa et les produits semblables m’ont trop souvent contrarié pour que je puisse rester objectif et mesuré. Je n’ai même pas eu besoin de posséder mon propre assistant pour en arriver là : me rendre chez des amis habitant des maisons plus ou moins connectées m’a suffi.
Bien sûr, les commandes vocales et la domotique ne sont pas toujours superflues – il existe des cas où Bixby, Cortana, Google Now et Siri peuvent se révéler vraiment utiles. Lorsque vos deux mains doivent rester sur le volant, ou si vous avez les bras dans le plâtre, c’est indubitablement pratique d’avoir à disposition un assistant qui réagit à votre voix.
À l’instar de bien des inventions dans le domaine numérique, les assistants vocaux peuvent s’avérer être aussi bien une malédiction qu’une bénédiction. Je vais tâcher de vous éclairer sur leurs avantages et leurs inconvénients.
L’autre jour, un ami m’a envoyé une blague. Mais comme je n’arrive pas à m’en souvenir précisément, je vais vous la retransmettre de mon mieux. « Dans les années 80, nous redoutions que nos conversations soient épiées par le biais de dispositifs cachés. En 2019, on demande à un dispositif d’écoute d’ajouter du papier toilette sur sa liste de courses. »
De nos jours, vous pouvez même choisir par qui vous allez être mis sur écoute. Les assistants vocaux les plus répandus se nomment Alexa chez Amazon, Siri chez Apple, Assistant chez Google, Cortana chez Microsoft et Bixby chez Samsung. Par ailleurs, certains services d’assistance téléphonique utilisent une technologie de reconnaissance vocale dans le but de récupérer des données sur les clients et les numéros de téléphone de ces derniers, ainsi que d’enregistrer des rapports d’erreur. Et n’oublions pas ma fonctionnalité vocale préférée : celle du GPS de ma voiture, que je pourrais qualifier de « têtue comme un âne ».
En soi, un assistant n’est pas grand-chose
En eux-mêmes, les assistants vocaux ne vont pas beaucoup plus loin que fournir des informations simples : m’informer de la météo, me lire les actualités, me dire quels cinémas passent le dernier Spider-Man. Pour devenir actifs, ils nécessitent des dispositifs domotiques – on peut alors parler de la fameuse « maison intelligente ».
Les maisons intelligentes sont les circuits de train électrique du 21e siècle : d’un côté, je comprends parfaitement l’agrément que cela procure de n’avoir qu’à prononcer quelques mots pour éteindre les lumières du rez-de-chaussée, plutôt que devoir redescendre les escaliers. D’un autre côté, ce plaisir est proche de celui que ressent l’enfant observant la petite barrière qui descend automatiquement au passage à niveau avant le passage du train miniature.
Les assistants vocaux associés à la domotique permettent de chauffer à l’avance votre logement, d’entrouvrir ses fenêtres, de fermer les volets, d’arroser la pelouse et de fermer les portes à clé. Tout cela que vous soyez à l’autre bout du monde ou dans votre bain. Les corvées que l’on demandait de faire au plus jeune enfant de la famille sont maintenant gérées par un assistant vocal (qui lui ne se plaindra jamais). Pour vous, c’est un progrès.
Où les assistants sont-ils utiles ?
Pour être tout à fait honnête, les assistants peuvent s’avérer extrêmement utiles. Par exemple, pour quelqu’un en fauteuil roulant, la domotique avec contrôle vocal permet d’être considérablement plus indépendant. Si pour vous atteindre la poignée de la fenêtre nécessite un effort exagéré, ou est simplement impossible, un moteur commandé à distance ne sera plus un jouet d’enfant, mais une amélioration sensible de votre qualité de vie.
Si vous avez le bras dans le plâtre à la suite d’un accident, un téléphone portable à votre écoute se révèlera une aide précieuse au cours des pénibles semaines de guérison (au fait, bon rétablissement !). Avec un GPS automobile, la commande vocale est à vrai dire idéale : si le système de guidage vous signale un bouchon alors que vous roulez à 130 km/h sur l’autoroute et vous demande si vous voulez prendre un raccourci qui vous fera gagner 30 minutes, il doit être capable de réagir sans faille à une interjection du type « Oh que oui ! ».
Tant qu’il y a des gens pour qui les assistants vocaux représentent une véritable amélioration de leur quotidien, et non un simple gadget, ça ne me pose pas de problème que la technologie de reconnaissance vocale se répande davantage – pourvu que je puisse toujours avoir un moyen de contrôle alternatif. Lorsque l’accueil vocal automatique de mon opérateur téléphonique devient trop énervant, je me mets à marmonner des paroles incompréhensibles jusqu’à ce que l’ordinateur abandonne et me mette en contact avec une vraie personne.
L’intelligence artificielle est-elle préférable à pas d’intelligence du tout ?
Les assistants vocaux sont souvent associés avec l’intelligence artificielle. En fonction de l’état d’esprit de l’auteur, cela évoquera quelque chose de formidable, ou de menaçant – dans un cas comme dans l’autre, ce n’est que du vent. Pour faire court : l’intelligence artificielle n’existe pas. « Machine learning » (apprentissage automatique) s’avère un terme bien plus juste : grosso modo, il est question d’ordinateurs qui apprennent à reconnaître des modèles et à réagir de façon appropriée.
Les assistants vocaux actuels n’ont même pas la capacité d’apprendre : la plupart des assistants de la génération actuelle sont seulement capables de réagir à un ensemble très limité de mots – et encore, ils sont quelquefois trop sélectifs. Récemment, un ami proche tentait de faire éteindre par une enceinte Alexa la lampe située à côté de son canapé. Il a essayé trois fois avec des intonations différentes, et en élevant la voix à chaque tentative. Je me suis tranquillement assis dans le canapé, hésitant entre compassion et moquerie.
On n’est peut-être pas loin du comportement d’un enfant têtu : quand j’étais petit, il m’arrivait de faire la sourde oreille quand ma maman m’appelait depuis le salon. Je savais qu’on avait besoin de moi, mais je n’avais simplement pas envie d’y aller.
En ce qui concerne Alexa cependant, elle ne fait probablement pas exprès de ne pas entendre – elle semble réellement quelque peu dure d’oreille Les enceintes ou les téléphones mobiles ne peuvent pas vraiment reconnaître grand-chose par eux-mêmes. En réalité, ces appareils enregistrent la commande et l’envoient vers un immense réseau neuronal dans le cloud, qui en retour indique à l’appareil comment il doit réagir. Si cette connexion est coupée, l’assistant vous fera part de son incompréhension – bien plus poliment qu’un enfant agacé, évidemment.
Sans assistance humaine, la génération actuelle des assistants vocaux serait un échec total. Amazon, mais aussi Google, savent que dans l’ombre, une armée de rédacteurs du tiers monde s’affaire à transcrire les conversations enregistrées en vue d’améliorer le taux de reconnaissance des assistants. Il est fort peu probable qu’Apple, Microsoft et Samsung aient un fonctionnement différent. Cela représente un véritable effort de s’assurer qu’Alexa finira par prendre une commande pour un approvisionnement en chips au vinaigre pour un an même lorsque vous parlez la bouche pleine.
La voix par défaut est toujours féminine
Il y a trop de choses élémentaires qui me dérangent au sujet des assistants vocaux pour ne serait-ce qu’en essayer un chez moi. À commencer par le fait qu’a priori, tous les assistants vocaux parlent avec une voix féminine chaleureuse.
Ce n’est pas que j’attende des assistants vocaux qu’ils s’expriment avec une voix grinçante à la Gilbert Gottfried. Il n’empêche que je reste contrarié par le fait que tous les assistants vocaux fonctionnent d’origine avec une voix féminine. À mon goût, le rôle stéréotypé de la femme soumise n’est pas sorti des mentalités depuis suffisamment longtemps. Seuls Apple Siri, Google Assistant et Samsung Bixby offent la possibilité de changer de genre – Google propose même un choix de quatre voix masculines. Amazon Alexa et Microsoft Cortana, de leur côté, ne proposent pas d’autre choix que le genre féminin – leurs voix chaleureuses ajoutent patiemment le papier toilette à votre liste de course, du moment qu’une connexion internet soit disponible.
La part de vérité plus amère dans la plaisanterie que j’ai faite au début s’avère un problème plus grave. Maintes et maintes fois, il est arrivé que des assistants vocaux enregistrent des conversations parce qu’ils ont pris un mot d’une conversation banale pour une commande. Aux États-Unis, on a rapporté que les enceintes Alexa réagissaient par milliers lorsque leur nom était prononcé à la télévision. Amazon a récemment déposé un brevet concernant Alexa pour que l’assistant exécute un ordre même si le mot d’activation vient après la commande en elle-même. Cela ne peut fonctionner que si le système est en écoute permanente.
In ioco veritas
De tels faits suscitent de nouvelles ambitions : les secrétaires à l’Intérieur allemands ont récemment exprimé l’idée que l’accès aux enregistrements vocaux des dispositifs de maison connectée ne devrait pas nécessiter l’autorisation d’un juge pour « mise sur écoute », mais simplement un mandat de perquisition – après tout, les enregistrements sont déjà existants et ils n’ont pas été spécialement enregistrés pour les enquêteurs.
Le débat public qui en a découlé m’a fait prendre conscience des problèmes élémentaires de protection des données soulevés par les assistants vocaux. Enfin, les entreprises comme Amazon, Apple et Google conservent et traitent les enregistrements de leurs assistants en se basant sur leurs propres règles. Dans un pays comme l’Allemagne, où une bonne partie de la population a subi une surveillance de l’État pendant des décennies, cela crée inévitablement un certain malaise.
Si Alexa n’est même pas capable de comprendre à coup sûr qu’elle doit éteindre une lampe, je n’ose même pas imaginer ce qui pourrait arriver si l’assistant comprenait de travers une discussion animée au sujet d’une attaque terroriste et l’interprétait comme la phase de planification d’un tel acte. Je vous laisse un instant, quelqu’un est en train de frapper à ma porte avec insistance...