Voz Resurge: IA e Assistentes de Voz em Nova Aposta Após ChatGPT

Voz Resurge no Mercado de IA Após o Domínio do Texto
Há três anos, o mercado de assistentes de voz parecia estar à beira do abandono. A popularidade do ChatGPT, que surgiu em novembro de 2022, desviou a atenção e os investimentos para a interação por texto, enquanto assistentes de voz como a Alexa viram a demanda diminuir. No entanto, a tendência está se revertendo, com as empresas apostando novamente na voz. Essa mudança deve ser o foco principal do AI Summit, organizado pela EXAME, que acontecerá em 2 de junho na Consolação, em São Paulo.
João Paulo Alqueres, especialista em IA conversacional e o único profissional da América do Sul a receber o título de Alexa Champion, concedido pela Amazon, acompanha essa reviravolta. Alqueres, cientista da computação pela Universidade do Estado do Rio de Janeiro, possui mais de 200 soluções de IA conversacional entregues a clientes internacionais através da sua startup, Iara Digital.
A Trajetória da Interação por Voz
A interação por voz ganhou destaque em 2011 com o lançamento da Siri pela Apple. A partir daí, a Alexa, que chegou aos Estados Unidos em 2014 e ao Brasil em 2019, consolidou-se como uma opção popular. Houve um período de expansão acelerada até que o ChatGPT, em 2023, mudou o cenário. A explicação reside na tecnologia: os primeiros assistentes de voz dependiam do processamento de linguagem natural, enquanto o ChatGPT introduziu uma abordagem baseada em texto.
Leia também
A voz, a imagem e o vídeo retornaram à equação apenas com o desenvolvimento de modelos de IA multimodais, capazes de receber e processar informações em diferentes formatos. A retomada do interesse na voz ocorreu com o amadurecimento da tecnologia de áudio, permitindo o surgimento de agentes digitais – sistemas que podem ser acionados por telefone para agendar horários ou resolver problemas, interagindo com uma IA de forma semelhante a um atendente humano. Empresas como a Eleven Labs se especializaram nesse campo, e a Amazon respondeu com a Alexa+. Em fevereiro de 2025, a Amazon anunciou a Alexa+, uma versão turbinada por IA generativa.
Novas Abordagens no Desenvolvimento
A forma de construir essas soluções também mudou. Tradicionalmente, os programadores escreviam cada linha de código para definir o comportamento do software. Com a IA, o trabalho se concentra em definir parâmetros, restrições e o contexto em que o agente deve operar, definindo o que ele pode dizer e quais ferramentas pode acessar. Essa abordagem resulta em uma democratização inédita, aproximando a intenção do usuário da sua materialização, eliminando a necessidade de intermediários.
Alqueres acredita que o próximo passo é a convergência, onde uma única IA pode reunir todos os sentidos – voz, imagem, vídeo – em um arranjo que ele considera caro e insustentável para o consumidor final. Um exemplo recente é a Thinking Machines, startup de Mira Murati, que apresentou um modelo de interação que ouve, vê e responde em tempo real, sem a rigidez do modelo tradicional de “fala e espera”.
O Futuro da Interação
Enquanto a tecnologia se adapta, as empresas estão voltando a buscar experiências de voz personalizadas, desde jogos até sistemas de atendimento. Após uma década de aprendizado, conversar se tornou a interface mais natural. João Paulo Alqueres levará essa perspectiva ao AI Summit, em junho, onde discutirá o futuro da interação por voz e a convergência de tecnologias.
Autor(a):
Redação ZéNewsAi
Aqui no ZéNewsAi, nossas notícias são escritas pelo José News! 🤖💖 Nós nos esforçamos para trazer informações legais e confiáveis, mas sempre vale a pena dar uma conferida em outras fontes também, tá? Obrigado por visitar a gente, você é 10/10! 😊 Com carinho, equipe ZéNewsAi 📰 (P.S.: Se encontrar algo estranho, pode nos avisar! Adoramos feedbacks fofinhos! 💌)


