Inteligência artificial “apaga” edifícios inteiros de imagens ao vivo

Pesquisadores da Universidade de Osaka, no Japão, desenvolveram um novo sistema de aprendizagem de máquina capaz de remover edifícios virtualmente de uma imagem ao vivo. Basta apontar o tablet ou celular para a paisagem para que o algoritmo apague o prédio do cenário.

Segundo os cientistas, essa “demolição” virtual é possível graças ao uso de redes generativas adversárias (GAN, na sigla em inglês) executadas em um servidor remoto e depois transmitidas em tempo real para um dispositivo móvel que pode estar a quilômetros de distância.

“Nosso método permite que os usuários entendam intuitivamente como será o cenário futuro, contribuindo para reduzir drasticamente o tempo e o custo para formar um consenso sobre a demolição real o que, geralmente, envolve a participação de várias partes interessadas”, explica o professor de engenharia civil Takuya Kikuchi, autor principal do estudo.

Streaming do futuro

Para gerar uma imagem em realidade aumentada, que pudesse ser exibida em tempo real por qualquer dispositivo móvel, todo o processamento é feito remotamente por um servidor dedicado. Isso garante que equipamentos comuns possam ser usados no local onde está o edifício que será apagado virtualmente.

Esquema de funcionamento da ferramenta de demolição virtual (Imagem: Reprodução/Osaka University)

Como é preciso acelerar o algoritmo para que ele possa renderizar uma imagem ao vivo, os pesquisadores utilizaram uma técnica conhecida como segmentação semântica. Esse método permite que o modelo de aprendizado profundo classifique as imagens pixel a pixel, ao contrário de sistemas convencionais que fazem essa detecção usando objetos em 3D.

“Os algoritmos GAN usam duas redes neurais concorrentes, uma geradora e outra discriminadora. A geradora é treinada para criar imagens mais realistas, enquanto a discriminadora distingue se a imagem é real ou produzida artificialmente. Ao aprender dessa maneira, o algoritmo pode criar imagens que não existem, mas são plausíveis”, acrescenta o professor de engenharia ambiental Tomohiro Fukuda.

Limitações

No protótipo desenvolvido pelos cientistas, o processamento de alta precisão se mostrou totalmente viável desde que o edifício a ser removido da paisagem não ultrapasse 15% da tela. Se esses parâmetros forem mantidos, o vídeo da demolição virtual pode ser transmitido a uma taxa média de 5,71 quadros por segundo.

Exemplos de como um edifício pode ser apagado virtualmente de uma imagem em tempo real (Imagem: Reprodução/Osaka University)

Porém, se o elemento a ser apagado virtualmente ocupar uma área maior, ocorrem distorções na imagem, gerando uma espécie de “fantasma” do edifício eliminado pela ferramenta. Esse fenômeno pode causar distorções significativas, comprometendo o resultado da amostra.

“Essa a primeira versão de nossa ferramenta para remoção digital de construções em tempo real. No futuro, queremos aperfeiçoar o processamento e ampliar o limite de tamanho do objeto a ser removido, para que o sistema possa ser usado efetivamente em ações de planejamento urbano”, encerra o professor Takuya Kikuchi.

FONTE: https://canaltech.com.br/inovacao/inteligencia-artificial-apaga-edificios-inteiros-de-imagens-ao-vivo-222315/