SoftMaker logo

Non solo bit e byte!

Assistenti vocali: dolcetto o scherzetto?


Innanzitutto, non aspettatevi una panoramica ponderata dei vari sistemi di assistenza vocale. Sono troppe le occasioni nelle quali Alexa & Co. mi ha davvero seccato per consentirmi di essere onesto ed obiettivo. Non ho mai avuto necessità di un mio assistente vocale per arrivare a queste considerazioni: mi à bastato andare a trovare alcuni amici che avevano installato dispositivi “Smart Home”.

Naturalmente, i sistemi di controllo vocale e la domotica non sempre sono privi di senso: in alcune condizioni Bixby, Cortana, Google Now e Siri possono risultare particolarmente utili. Quando si devono mantenere entrambe le mani sul volante, oppure se si hanno le braccia ingessate un’assistente vocale che può essere gestito dalla voce diventa davvero utile.

Come molte altre invenzioni tecnologiche, anche gli assistenti vocali hanno i loro pro e contro. Ed è proprio sui pro e sui contro che vorrei concentrarmi.


Un giorno un mio amico mi ha inviato una storiella che adesso non trovo più, ma che posso riassumere a memoria. “Negli anni Ottanta del Novecento pensavamo: ‘Oh, Dio, siamo intercettati da dispositivi di ascolto nascosti!’ Ma nel 2019 siamo pronti a dire: ‘Ehi, dispositivo vocale, inserisci nella mia lista della spesa anche la carta igienica’.”

Oggi abbiamo anche la possibilità di scegliere da chi farci intercettare. I più noti assistenti vocali attualmente disponibili sono Alexa di Amazon, Siri di Apple, Assistant di Google, Cortana di Microsoft e Bixby di Samsung. Tuttavia, alcune linee di assistenza telefonica aziendali adottano una tecnologia di riconoscimento vocale per la registrazione dei dati e dei numeri di telefono degli utenti e per la generazione di rapporti di errore. E non voglio qui dimenticare le funzioni vocali che preferisco: quelle del mio GPS in auto, che sarebbe essere meglio descrivere come “testardo come un mulo”.

Di per se stessi, gli assistenti vocali non sono poi dei dispositivi così complessi.

Non fanno altro che fornire informazioni basilari: condizioni meteorologiche, lettura dei quotidiani o segnalare in quale sala stanno trasmettendo l’ultimo film dell’Uomo ragno. Per essere davvero attivi, gli assistenti vocali devono poter accedere a ulteriori sistemi di domotica, in pratica quelli associati alla parola chiave “Smart Home”.

Le “Smart Home” (ovvero le case intelligenti) possono essere assimilate a un plastico ferroviario del XXI secolo: da una parte posso comprendere la soddisfazione di poter pronunciare poche parole per spegnere le luci al piano terreno senza per questo dover di nuovo scendere le scale per farlo. Dall’altra, questa soddisfazione diventa davvero puerile quando la si paragona all’abbassamento automatico delle sbarre di un passaggio a livello di un plastico ferroviario prima del transito del trenino in arrivo.

Gli assistenti vocali connessi ai sistemi di domotica possono attivare il riscaldamento preventivo di un’abitazione, aprire le finestre a compasso, abbassare le tapparelle, irrigare il prato o chiudere a chiave le porte. E tutto questo lo si può fare a distanza, oppure mentre si è immersi in una vasca da bagno.. I compiti una volta richiesti al figlio più piccolo di una famiglia possono ora essere eseguiti da un assistente vocale che non si lamenterà mai! E questo è un progresso.

Quando è che gli assistenti vocali diventano davvero utili

Per essere onesto, devo dire che gli assistenti vocali possono anche essere estremamente utili. Per esempio, per una persona costretta su una carrozzina la domotica gestita a un assistente vocale può significare un sostanziale passo in avanti per la sua indipendenza. Quando si è in condizioni di raggiungere, anche se con difficoltà, solo la maniglia di una finestra, oppure quando non si è in grado di farlo affatto, il motore di un assistente vocale non è più un giocattolo per bambini, ma un vero miglioramento della qualità della vita.

Se si ha un braccio ingessato a causa di un incidente, la presenza di un telefono mobile in grado di ascoltare potrebbe contribuire ad alleviare le noiose settimane di guarigione (con l’augurio, comunque, di guarire il più rapidamente possibile). In un sistema GPS per auto, il controllo vocale è un’opzione indispensabile: quando il navigatore segnala un ingorgo stradale su un’autostrada percorribile a 120 km/h suggerendo un itinerario alternativo di 30 km più breve, dovrebbe anche essere in grado di reagire quando gli si dice “Ma certo, ci mancherebbe!”

Fintanto che ci saranno persone che considerano un assistente vocale come un miglioramento della loro vita e non sono come un giocattolo, lo sviluppo della tecnologia degli assistenti vocali non mi preoccupa, sempre che questo mi permetta di agire in modo diverso. Quando il sistema di casella vocale del mio operatore telefonico diventa eccessivamente fastidioso comincio a borbottare cose incomprensibili fino a quando il computer si arrende all’evidenza e mi connette a una persona reale.

L’intelligenza artificiale è meglio di nulla?

Gli assistenti vocali vengono spesso associati all’intelligenza artificiale. A seconda dell’umore di chi scrive, questa affermazione può richiamare uno stato di freddezza, oppure essere considerata una minaccia anche se, in entrambi i casi, non è altro che “aria fritta”. In poche parole... l’intelligenza artificia non esiste. Per usare un termine molto più preciso si dovrebbe parlare di “Apprendimento automatico” (o “Machine learning”), in parole povere, un computer che apprende come riconoscere dei modelli e come reagire agli stessi.

Gli attuali assistenti vocali non imparano nulla: la maggior parte delle generazioni attuali sono solo in grado di reagire a una serie molto limitata di parole e, anche in questo caso, possono essere molto “schizzinosi”. Non molto tempo fa un amico ha cercato di comunicare a un assistente vocale Alexa di spegnere la lampada accanto al divano. Ci ha provato per tre volte cambiando l’intonazione della voce e, a ogni tentativo, aumentandone il volume quando formulava la propria richiesta. Io me ne stavo tranquillamente seduto sul divano e non sapevo se provare pietà per lui o se farmi una risata.

Mi viene il dubbio che la differenza con un bambino testardo non sia poi così grande: da bambino, quando mia madre gridava il mio nome dal soggiorno, facevo finta di non sentirla. Lo sapevo che aveva bisogno di me, ma non mi importava molto.

Probabilmente, Alexa non stava fingendo, ma sembrava essere davvero un po’ duro d’orecchio. Gli altoparlanti o i telefoni mobili, di per se stessi, non sono in grado di riconoscere molto. Al contrario, si limitano a registrare un comando e inviarlo a una grande rete neurale nel cloud che, successivamente, ritrasmette al dispositivo “stupido” come reagire alla richiesta. Se questa interconnessione si interrompe, l’assistente non farà altro che dire “Eh?”, anche se, ovviamente, lo farà in modo molto più educato di un bambino.

Senza alcun aiuto umano aggiuntivo, la generazione attuale di assistenti vocali sarebbe un fallimento completo. È ormai risaputo che Amazon e Google, dietro le quinte si affidano a un esercito di scrittori del Terzo Mondo il cui compito è trascrivere le conversazioni registrate per migliorare i tassi di riconoscimento degli assistenti vocali. Ed è prevedibile che Apple, Microsoft e Samsung si comportino in modo simile. Si tratta di uno sforzo destinato solo ad assicurare che Alexa possa trasmettere correttamente un ordine di una fornitura annuale di patatine salate e aromatizzate anche quando la richiesta viene fatta mentre si ha la bocca piena.

La voce standard è sempre femminile

Sono troppe le cose che mi impediscono di prendere in considerazione l’installazione in casa mia di un assistente vocale. La prima è che gli assistenti vocali utilizzano sempre una calda e suadente voce femminile.

Questo non vuol dire che io preferisca un assistente vocale con voce maschile e stridula come quella del comico statunitense Gilbert Gottfried. Quello che mi dà fastidio è il fatto che tutti gli assistenti vocali utilizzino per default una voce femminile. Dal mio punto di vista, il cliché del ruolo della donna sottomessa non è ancora morto. Solo Apple Siri, Google Assistant e Samsung Bixby consentono di modificare il genere della voce, e Google offre una scelta di quattro voci maschili. Amazon Alexa e Microsoft Cortana, d’altra parte, persistono con una voce femminile che, sempre che sia attiva una connessione Internet, aggiunge cortesemente al carrello l’ordine di carta igienica.

Un aspetto più profondo è l’amarezza del senso di verità insito nella storiella che ho raccontato all’inizio dell’articolo. Accade sempre più di frequente che gli assistenti vocali registrino le conversazioni casuali perché interpretano una parola di una normale conversazione come un comando di attivazione. Si dice che negli Stati Uniti, gli altoparlanti Alexa abbiano captato migliaia di frasi contenenti il suo nome, ma provenienti dall’audio di un apparecchio televisivo. Amazon ha recentemente registrato un brevetto che consente ad Alexa di eseguire un’istruzione anche se la parola di attivazione viene pronunciata dopo il comando di attivazione. Ma questo funziona solo se il sistema è in modalità di ascolto continua.

In ioco veritas

Queste circostanze risvegliano nuove considerazioni: le segreterie del Ministero degli Interni tedesco hanno recentemente espresso l’opinione che per l’accesso alle registrazioni vocali effettuate da dispositivi “Smart Home” non è necessario un mandato di un giudice per le operazioni di “intercettazioni ambientali”, ma solo un mandato di perquisizione. In effetti, le registrazioni erano già presenti e non specificatamente effettuate per scopi di indagine.

È stato necessario un dibattito pubblico per chiarirmi i problemi che stanno alla base della protezione dei dati in materia di assistenti vocali. Infine, Amazon, Apple, Google & Co. memorizzano ed elaborano le registrazioni degli assistenti vocali attenendosi a proprie regole interne. In un Paese come la Germania, dove una buona parte della popolazione è stata per decenni soggetta a una sorveglianza di Stato, questa situazione crea inevitabilmente una condizione di disagio.

Se Alexa non è in grado di comprendere correttamente di dover spegnere una lampada a pavimento, non voglio neanche immaginare che cosa potrebbe accadere se l’assistente vocale dovesse interpretasse scorrettamente una normale e innocente discussione sugli attacchi terroristici come se si trattasse di una loro reale progettazione. Torno fra un attimo... C’è qualcuno che bussa insistentemente alla mia porta...



Aggiungi commento

Grazie.

Il prodotto è stato aggiunto al carrello.