Non solo bit e byte!
Assistenti vocali: dolcetto o scherzetto?

Innanzitutto, non aspettatevi una panoramica ponderata dei vari sistemi di assistenza vocale. Sono troppe le occasioni nelle quali Alexa e compagni mi hanno davvero innervosito per consentirmi di essere onesto e obiettivo. Non ho mai avuto la necessità di un mio assistente vocale per arrivare a queste considerazioni: mi è bastato andare a trovare alcuni amici che avevano installato dispositivi per la “Casa intelligente”.
Naturalmente, i sistemi di controllo vocale e la domotica non sono sempre privi di senso: in alcune circostanze Bixby, Cortana, Google Now e Siri possono risultare particolarmente utili. Quando si devono mantenere entrambe le mani sul volante, oppure se si hanno le braccia ingessate un’assistente vocale diventa davvero utile.
Come molte altre invenzioni tecnologiche, anche gli assistenti vocali hanno i loro pro e contro. Ed è proprio sui pro e sui contro che vorrei concentrarmi.
Un giorno un mio amico mi ha inviato una storiella che adesso non trovo più, ma che proverò a raccontare a memoria. “Negli anni Ottanta del Novecento pensavamo: ‘Oh, Dio, ci sono dei dispositivi di ascolto nascosti pronti a intercettare le nostre comunicazioni!’ Ma nel 2019 siamo pronti a dire: ‘Ehi, dispositivo vocale, inserisci nella mia lista della spesa anche la carta igienica’.”
Oggi abbiamo anche la possibilità di scegliere da chi farci intercettare. I più noti assistenti vocali attualmente disponibili sono Alexa di Amazon, Siri di Apple, Assistant di Google, Cortana di Microsoft e Bixby di Samsung. Tuttavia, alcune linee di assistenza telefonica aziendali adottano una tecnologia di riconoscimento vocale per la registrazione dei dati e dei numeri di telefono degli utenti e per la generazione di rapporti di errore. E non voglio qui dimenticare le funzioni vocali che preferisco: quelle del mio GPS in auto, che sarebbe meglio descrivere come “testardo come un mulo”.
Di per sé, gli assistenti vocali non sono poi dei dispositivi così complessi.
Non fanno altro che fornire informazioni basilari: condizioni meteorologiche, lettura dei quotidiani o segnalare in quale sala stanno trasmettendo l’ultimo film dell’Uomo ragno. Per essere davvero attivi, gli assistenti vocali devono poter accedere a ulteriori sistemi di domotica, in pratica quelli associati al concetto di “Casa intelligente”.
Le case intelligenti possono essere assimilate a un plastico ferroviario del XXI secolo: da una parte posso comprendere la soddisfazione di poter pronunciare poche parole per spegnere le luci al piano terreno senza per questo dover di nuovo scendere le scale per farlo. Dall’altra, questa soddisfazione diventa davvero puerile quando la si paragona all’abbassamento automatico delle sbarre di un passaggio a livello di un plastico ferroviario prima del transito del trenino in arrivo.
Gli assistenti vocali connessi ai sistemi di domotica possono attivare in anticipo il riscaldamento di un’abitazione, aprire le finestre a compasso, abbassare le tapparelle, irrigare il prato o chiudere a chiave le porte. E tutto questo lo si può fare a distanza, oppure direttamente dalla vasca da bagno.. I compiti una volta richiesti al figlio più piccolo di una famiglia possono ora essere eseguiti da un assistente vocale che non si lamenterà mai! E questo è progresso!
Quando gli assistenti vocali diventano davvero utili
Per essere onesto, devo dire che gli assistenti vocali possono anche essere estremamente utili. Per esempio, per una persona costretta su una carrozzina la domotica gestita da un assistente vocale può significare un sostanziale passo in avanti verso la sua indipendenza. Quando si è in condizioni di raggiungere con molte difficoltà solo la maniglia di una finestra, oppure quando non si è in grado di farlo affatto, il sistema di comando vocale non è più solo un giocattolo per bambini, ma un vero miglioramento della qualità della vita.
Se si ha un braccio ingessato a causa di un incidente, la presenza di un telefono mobile in grado di ascoltare potrebbe contribuire ad alleviare le noiose settimane di guarigione (con l’augurio, comunque, di guarire il più rapidamente possibile). In un sistema GPS per auto il controllo vocale è un’opzione indispensabile: quando si viaggia a 120 km/h in autostrada e il navigatore segnala un ingorgo stradale suggerendo un itinerario alternativo di 30 minuti più breve, dovrebbe anche essere in grado di reagire rispondendo “Ma certo, ci mancherebbe!”
Finché ci saranno persone che considerano l’assistente vocale come un miglioramento della qualità della vita e non sono come un giocattolo, lo sviluppo della tecnologia degli assistenti vocali non mi preoccupa, sempre che questo mi permetta di agire in modo diverso. Quando il sistema di messaggistica vocale del mio operatore telefonico diventa eccessivamente fastidioso, comincio a borbottare cose incomprensibili fino a quando il computer si arrende all’evidenza e mi connette a una persona reale.
L’intelligenza artificiale è meglio di nessuna intelligenza?
Gli assistenti vocali vengono spesso associati all’intelligenza artificiale. A seconda dell’umore di chi scrive, questa affermazione può essere completamente indifferente oppure venire considerata una minaccia anche se, in entrambi i casi, non è altro che “aria fritta”. In poche parole... l’intelligenza artificiale non esiste. Per usare un termine molto più preciso si dovrebbe parlare di “Apprendimento automatico” (o “Machine learning”): in parole povere, un computer che apprende come riconoscere dei modelli e come reagire agli stessi.
Gli attuali assistenti vocali non imparano nulla: la maggior parte delle generazioni attuali sono solo in grado di reagire a una serie molto limitata di parole e, anche in questo caso, possono essere molto “schizzinosi”. Non molto tempo fa un amico ha cercato di comunicare a un assistente vocale Alexa di spegnere la lampada accanto al divano. Ci ha provato per tre volte cambiando l’intonazione della voce e, a ogni tentativo, aumentando il volume formulando la propria richiesta. Io me ne stavo tranquillamente seduto sul divano e non sapevo se provare pietà o farmi una bella risata.
Mi viene il dubbio che la differenza con un bambino testardo non sia poi così grande: da bambino, quando mia madre gridava il mio nome dal soggiorno, facevo finta di non sentirla. Lo sapevo che aveva bisogno di me, ma non me ne importava praticamente nulla.
Probabilmente Alexa non stava fingendo, ma sembrava essere davvero un po’ duro d’orecchio. Gli altoparlanti o i cellulari, di per sé, non sono in grado di riconoscere molto. Al contrario, si limitano a registrare un comando e inviarlo a una grande rete neurale nel cloud che, successivamente, ritrasmette al dispositivo “stupido” come reagire alla richiesta. In caso di interruzione della connessione, l’assistente non farà altro che dire “Eh?”, anche se, ovviamente, in modo molto più educato di un bambino.
Senza alcun aiuto umano supplementare, la generazione attuale di assistenti vocali sarebbe un fallimento completo. È ormai risaputo che Amazon e Google, si affidano dietro le quinte a un esercito di scrittori del Terzo Mondo il cui compito è trascrivere le conversazioni registrate per migliorare i tassi di riconoscimento degli assistenti vocali. Ed è prevedibile che Apple, Microsoft e Samsung si comportino in modo simile. Si tratta di uno sforzo destinato solo ad assicurare che Alexa possa trasmettere correttamente un ordine per la fornitura annuale di patatine fritte anche se si ha la bocca piena.
La voce standard è sempre femminile
Sono troppe le cose che mi impediscono di prendere in considerazione l’installazione in casa mia di un assistente vocale. La prima è che gli assistenti vocali utilizzano sempre una calda e suadente voce femminile.
Questo non vuol dire che io preferisca un assistente vocale con la stridula voce maschile del comico statunitense Gilbert Gottfried. Quello che mi dà fastidio è il fatto che tutti gli assistenti vocali utilizzino per default una voce femminile. Dal mio punto di vista, il cliché del ruolo della donna sottomessa non è ancora morto. Solo Apple Siri, Google Assistant e Samsung Bixby consentono di modificare il genere della voce, con Google che offre una scelta di ben quattro voci maschili. Amazon Alexa e Microsoft Cortana, d’altra parte, persistono con una voce femminile che, sempre che sia attiva una connessione Internet, aggiunge cortesemente al carrello l’ordine di carta igienica.
Il problema più profondo è l’amara verità della storiella che ho raccontato all’inizio dell’articolo. Accade sempre più di frequente che gli assistenti vocali registrino conversazioni casuali perché interpretano una parola in una normale conversazione come un comando di attivazione. Si dice che negli Stati Uniti, i dispositivi Alexa abbiano captato migliaia di frasi contenenti il suo nome, ma provenienti dall’audio di programmi televisivi. Amazon ha recentemente registrato un brevetto che consente ad Alexa di eseguire un’istruzione anche se la parola di attivazione viene pronunciata dopo il comando di attivazione. Ma questo funziona solo se il sistema è in modalità di ascolto continua.
In ioco veritas
Queste circostanze risvegliano nuove considerazioni: il Ministero dell’interno tedesco ha recentemente espresso l’opinione che per l’accesso alle registrazioni vocali effettuate da dispositivi “intelligenti” non è necessario un mandato di un giudice per le “intercettazioni ambientali”, ma solo un mandato di perquisizione. In effetti, le registrazioni erano già presenti e non specificatamente effettuate per scopi di indagine.
Il successivo dibattito pubblico mi ha aiutato a capire meglio i problemi alla base della protezione dei dati in materia di assistenti vocali. Infine, Amazon, Apple, Google & Co. memorizzano ed elaborano le registrazioni degli assistenti vocali attenendosi a proprie norme interne. In un Paese come la Germania, dove una buona parte della popolazione è stata per decenni soggetta a una sorveglianza di Stato, questa situazione crea inevitabilmente una condizione di disagio.
Se Alexa non è in grado di comprendere correttamente di dover spegnere una lampada a pavimento, non voglio neanche immaginare che cosa potrebbe accadere se l’assistente vocale non dovesse interpretare correttamente una normale e innocente discussione sugli attacchi terroristici, associandola a una loro reale progettazione. Torno fra un attimo... C’è qualcuno che bussa insistentemente alla mia porta...