Dispositivo possibilita processar comandos complexos e realizar pesquisas de modo simultâneo
Divulgação
O assistente capaz de executar múltiplas funções, por meio de automação e controle de dados
Redação/Hourpress
A partir dos avanços tecnológicos e da rotina corrida, os produtos domésticos inteligentes são cada vez mais buscados em todo o mundo. Com o sucesso dos assistentes virtuais, ficou cada vez mais fácil automatizar tarefas utilizando somente a voz. Mesmo com a habilidade de criar lembretes e alarmes, informar as notícias do dia, citar a previsão do tempo ou tocar músicas, as assistentes digitais ainda possuem limitações em seguir comandos complexos. A partir da limitação tecnológica destes dispositivos, o estudante de Engenharia da Computação do Centro Universitário de Brasília (CEUB), Renato Barbosa (27) projetou uma assistente capaz de executar múltiplas funções, por meio de automação e controle de dados.
Com uma arquitetura ideal para a implementação de buscas e execução de diversas funções para assistentes virtuais, o aparelho criado pelo estudante do CEUB oferece uma nova experiência para o usuário automatizando um ciclo de tarefas e usando um algoritmo que se adapta à pesquisa do usuário. Apenas por comandos de voz, o protótipo inteligente permite aplicar filtros nas buscas, resultados de vídeos, imagens e até fazer downloads.
O formando de Engenharia da Computação explica que o programa é de fácil uso e possui funções que são uteis para o usuário no cotidiano, com relevância personalizada nas pesquisas, permitindo vários pedidos em uma só frase. “O algoritmo separa a função e seus respectivos argumentos, gerando um código. Deste modo, a pesquisa é executada e o usuário recebe um só resultado, que abre direto no navegador. Caso não goste, o usuário pode pedir a troca da pesquisa com outro comando”, explicou.
Tarefas
Composto por reconhecimento de voz, sintetizador de voz, buscador, núcleo de funções e um sistema que executa múltiplas funções, o projeto integra vários comandos, que de forma direta realiza pesquisas mais apuradas e realiza tarefas simultâneas. Além disso, o sistema é capaz de armazenar a busca para que a mesma possa ser usada posteriormente, com a execução de uma nova tarefa, sendo possível automatizar tarefas de navegação no computador.
Para desenvolver o projeto, o estudante atuou em três fases: sistema de tempo real, classificador e execução de funções. A primeira etapa consistiu em encapsular o formato básico dos programas existentes no mercado, com testes de sensores e microfone. Depois disso, foi criado o sintetizador de voz, com a base de dados “SpeechRecognition”, que converte o texto dentro da variável em voz, podendo configurar idioma, velocidade e a voz. Em seguida veio o classificador e o núcleo de execução, responsável por receber, ordenar e executar as funções localizadas na busca.
Potencial “de ferro”
Para o orientador do projeto, o professor de Engenharia da Computação Fábio Oliveira a inspiração do estudante veio da IA (Jarvis), do Homem de Ferro, para criar um modelo que pudesse provar que as assistentes podem ter um potencial muito maior do que já existe. “Testamos as assistentes mais conhecidas - Google Assistent, Alexa e Cortana. Depois dos testes, catalogamos o que não era possível ser feito e modelamos uma arquitetura que pudesse tratar algumas dessas limitações”, explica.
O professor considera a acessibilidade um grande ponto positivo do assistente, uma vez que o modelo conta com um classificador de frase e execução de funções dinâmicas, ainda não existente no mercado. “Usamos bibliotecas que, combinadas, nos deram esse resultado. Foi um grande desafio fazer um assistente do zero, ainda mais porque não existia nenhum outro modelo parecido”, completa.
Após o sucesso da pesquisa apresentada, Renato trabalha para implementar mais funções offline no controle do sistema operacional. “Estamos aprimorando o projeto. Quero adicionar um sistema para melhorar o resultado das buscas, estudar a possibilidade de downloads por voz, assim como players de vídeos, músicas, reconhecimento de voz offline, criar tradução em tempo real e executar cálculos por voz”, almeja o formando do CEUB.