Google admite que editou vídeo de demonstração do Gemini para fazê-lo parecer mais impressionante do que é

A apresentação não aconteceu em tempo real, como a empresa faz parecer. Ao invés disso, foram usados quadros de imagens estáticas e incluída interação de voz.

O Google lançou há dois dias o Gemini 1.0, uma nova linguagem de inteligência artificial multimodal. No mesmo dia, publicou no YouTube um vídeo de demonstração, intitulado Hands-on with Gemini: Interacting with multimodal AI (Prática com Gemini: Interagindo com IA multimodal, em português), que impressionou os internautas e já está com mais de 1,6 milhões de visualizações (assista abaixo).

Na gravação, o sistema é testado em uma série de desafios. Por exemplo, imagens são mostradas a ele para que dissesse o que estava vendo. As respostas são dadas imediatamente e, enquanto faz isso, a IA ainda dá algumas informações sobre os objetos.

O problema é que o vídeo não é tão verdadeiro quanto parece. Na descrição da postagem, a big tech informa que o editou para acelerar os resultados: “Para os fins desta demonstração, a latência foi reduzida e as saídas do Gemini foram encurtadas por questões de brevidade”, escreveu.

Parmy Olson, colunista da Bloomberg, observou que a apresentação não aconteceu em tempo real com instruções faladas. Ao invés disso, foram usados quadros de imagens estáticas e escritas e incluída interação de voz.

“Isso é bem diferente do que o Google parecia sugerir: que uma pessoa pudesse ter uma conversa de voz tranquila com o Gemini enquanto ele observava e respondia em tempo real ao mundo ao seu redor”, escreve Olson em um artigo publicado na quinta-feira (7).

Ao ser questionada sobre isso pelo portal The Verge, a big tech indicou uma postagem de Oriol Vinyals, vice-presidente de pesquisa e líder de aprendizado profundo do DeepMind do Google e co-líder do Gemini.

Ele publicou o seguinte no X (ex-Twitter): “Todas as solicitações e resultados do usuário no vídeo são reais, abreviados para fins de brevidade. O vídeo ilustra como poderiam ser as experiências de usuário multimodo construídas com o Gemini. Fizemos isso para inspirar os desenvolvedores”.

Vinyals acrescentou que foi dado a IA sequências de diferentes modalidades – imagem e texto – para ela respondesse prevendo o que viria a seguir. “Os desenvolvedores podem tentar coisas semelhantes quando o acesso ao Pro for aberto em 13/12”, completou.

FONTE:

https://epocanegocios.globo.com/inteligencia-artificial/noticia/2023/12/google-admite-que-editou-video-de-demonstracao-do-gemini-para-faze-lo-parecer-mais-impressionante-do-que-e.ghtml