Além dos bytes
Assistentes de voz: doces ou travessuras?

Em primeiro lugar: não espere que eu forneça uma visão equilibrada sobre os assistentes de voz. A Alexa e companhia já me irritaram demais para que eu continue justo e equilibrado. Eu nem precisei do meu próprio assistente para chegar a este ponto: visitas a amigos com casas mais ou menos inteligentes foram suficientes.
É claro, o controle por voz e a automação residencial nem sempre são inúteis — em algumas situações, Bixby, Cortana, Google Now e Siri podem ser muito úteis. Quando as duas mãos precisarem ficar no volante ou seus braços estiverem presos em gesso, é muito prático ter um assistente que segue os seus comandos.
Como muitas das invenções digitais, os assistentes de voz podem ser tanto uma maldição, quanto uma benção. Deixe-me ajudar você a ponderar os prós e contras.
Outro dia, um amigo me enviou uma piada que não consigo mais encontrar, me forçando a reconstruí-la com a memória. “Nos anos 1980 nos preocupávamos: Ah, Deus, estamos sendo espionados por dispositivos de escuta escondidos! Em 2019: Olá, dispositivo ouvinte, adicione papel higiênico à minha lista de compras.”
Hoje, você pode até escolher quem deve fazer a espionagem. Os assistentes de voz mais conhecidos são Alexa da Amazon, Siri da Apple, Google Assistante, Cortana da Microsoft e Bixby da Samsung. No entanto, algumas linhas de ajuda corporativas também utilizam tecnologia de reconhecimento de voz para obter dados do cliente e números de telefone, bem como registrar relatórios de erros. E não vamos esquecer o meu favorito, o recurso de voz do GPS do meu carro, que pode ser melhor descrito como “teimoso como um burro do sul”.
Por si só, os assistentes não são grande coisa
Sozinhos, os assistentes de voz fornecem poucas coisas além de informações básicas: como está o clima, quais são as notícias, em quais cinemas está passando o último filme do Homem-Aranha. Para se tornarem ativos, eles precisam de hardware de automação residencial adicional — e eis o chavão “Casa inteligente”.
Casas inteligentes são as ferrovias modelo do século 21: por um lado, eu entendo a satisfação em só precisar dizer algumas palavras para apagar as luzes no térreo, em vez de precisar descer as escadas mais uma vez. Por outro lado, essa diversão é tão infantil quanto o abaixar automático das minicancelas em cruzamentos de ferrovia antes da locomotiva elétrica de brinquedo passar.
Assistentes de voz e hardware de automação residencial podem pré-aquecer apartamentos, abrir janelas, abaixar persianas, irrigar gramados e trancar portas. Tudo isso remotamente ou a partir da banheira. As tarefas antes atribuídas à criança mais nova da família agora são realizadas por um assistente de voz — que nunca reclamará. Isso é um progresso.
Situações em que os assistentes são úteis
Para ser justo, os assistentes podem ser extremamente úteis. Por exemplo, para uma pessoa em uma cadeira de rodas, a automação residencial controlada por voz pode representar um ganho significativo de independência. Se você só consegue alcançar o puxador da janela com agonia ou nem consegue, um motor controlado remotamente deixa de ser um brinquedo infantil, mas sim um enriquecimento sensível para sua qualidade de vida.
Se o seu braço ficar em um molde de gesso depois de um acidente, um celular capaz de escutar ajuda a suportar as tediosas semanas de cura (a propósito, melhoras). Com um GPS de carro, o controle por voz é, na verdade, uma necessidade — se o navegador relatar um congestionamento a 120 km/h na estrada e perguntar se você deseja pegar um atalho 30 minutos mais curto, ele deverá ser capaz de reagir de modo confiante a um grito de “ah, Deus, sim, por favor”.
Enquanto houver pessoas para as quais assistentes de voz representam uma melhoria útil em suas vidas e não apenas um gadget nerd, não me importo que a tecnologia de reconhecimento de voz se espalhe ainda mais — desde que seja opcional. Quando o sistema de correio de voz do meu provedor de telefonia se torna muito irritante, eu começo a resmungar de maneira incompreensível até o computador desistir e me transferir para uma pessoa real.
A inteligência artificial é melhor do que nenhuma inteligência?
Os assistentes de voz normalmente têm por trás alguma inteligência artificial. Dependendo da atitude do escritor, isso deve invocar frieza ou uma ameaça — em ambos os casos, nada além de bobagens. Em resumo, a inteligência artificial não existe. “Aprendizado de máquina” é um termo muito mais preciso: a grosso modo, é uma questão de computadores aprendendo a reconhecer padrões e reagir de acordo.
Os assistentes de voz atuais nem aprendem: a maior parte da geração atual só consegue reagir a um conjunto bem limitado de palavras e mesmo assim podem ser bem exigentes. Recentemente, um amigo meu tentou pedir pra um dispositivo Alexa apagar a lâmpada ao lado de seu sofá. Ele tentou três vezes usando entonações diferentes, aumentando o volume da voz a cada tentativa. Eu sentado em silêncio no sofá, em dúvida se ficava com pena ou zombava dele.
Talvez a diferença para uma criança teimosa não seja tão grande: quando criança, às vezes eu fingia que não ouvia quando a minha mãe gritava o meu nome da sala de estar. Eu sabia que ela estava me chamando, mas eu não estava a fim.
No entanto, a Alexa provavelmente não estava fingindo — ela realmente parece ter dificuldades em escutar. Alto-falantes ou celulares não conseguem reconhecer muita coisa por conta própria. Em vez disso, eles gravam o comando e enviam para uma grande rede neural na nuvem, que, então, diz ao hardware estúpido como reagir. Se esta conexão for quebrada, o assistente simplesmente ficará perdido — de modo muito mais educado que uma criança indignada, é claro.
Sem ajuda humana adicional, a geração atual de assistentes de voz seria um fracasso completo. Sabe-se da Amazon e da Google que, nos bastidores, uma falange de escritores do terceiro mundo está transcrevendo freneticamente conversas registradas para melhorar as taxas de reconhecimento dos assistentes. Apple, Microsoft e Samsung dificilmente são diferentes. É um esforço e tanto só para garantir que a Alexa realize, eventualmente, um pedido de um ano de estoque de batatas de sal e vinagre, embora sua boca já estivesse cheia.
A voz padrão é sempre feminina
Muitas coisas básicas me incomodam a respeito dos assistentes de voz para que eu dê uma chance a eles em minha casa. Isso começa pelo fato de que todos os assistentes de voz parecem falar com vozes femininas calorosas.
Não é que eu deseje que os assistentes de voz falem em um tom masculino estridente à la Gilbert Gottfried. Mas ainda me incomoda o fato de que todos os assistentes de voz são femininos, por padrão. Para o meu gosto, o estereótipo da mulher submissa não ficou fora de moda por tempo suficiente. Somente a Siri da Apple, o Google Assistante e a Bixby da Samsung oferecem a opção de mudar o gênero — a Google até oferece quatro opções de voz masculina. A Alexa da Amazon e a Cortana da Microsoft, por outro lado, estão travadas no gênero feminino — suas vozes calorosas adicionando pacientemente papel higiênico à sua lista de compras, desde que haja conexão com a Internet.
Um problema mais profundo é o núcleo de verdade amargo na piada que mencionei no início. Repetidamente, os assistentes de voz gravaram conversas pois confundiram uma palavra de uma conversa casual com um comando de ativação. Nos EUA, há milhares de relatos de que os alto-falantes Alexa reagiram quando o nome foi mencionado na TV. A Amazon registrou recentemente uma patente para a Alexa executar uma instrução mesmo que a palavra de ativação venha depois do próprio comando. Isso só funciona se o sistema estiver escutando constantemente.
In ioco veritas
Tais circunstâncias despertam novos desejos: ministros alemães do interior expressaram recentemente a opinião de que o acesso a gravações de voz de dispositivos de casa inteligente não deveria exigir a permissão de um juiz para “vigilância acústica”, mas sim um mero mandado de busca: afinal de contas, as gravações já estavam lá e não foram gravadas especificamente pelos investigadores.
Foi necessário o debate público resultante para deixar claro para mim os problemas básicos de proteção de dados gerados pelos assistentes de voz. Em última instância, Amazon, Apple, Google e companhia armazenam e processam as gravações de seus assistentes de acordo com suas próprias regras. Em um país, como a Alemanha, em que boa parte da população passou por vigilância sistemática do estado durante décadas, isso gera um desconforto inevitável.
Se a Alexa nem mesmo entenderá de maneira confiável que ela deve apagar uma lâmpada, eu não quero imaginar o que poderá acontecer se o assistente confundir um debate vigoroso sobre ataques terroristas com um plano específico para realizar um. Aguarde um instante, tem alguém batendo insistentemente na minha porta...
Comentários