Google integra novas funções no Gemini Live com busca visual e legendas

Conheça as melhorias em desenvolvimento no Gemini Live, como busca visual com Circle to Search e controles de legendas para uma experiência aprimorada.
Atualizado há 7 horas atrás
Google integra novas funções no Gemini Live com busca visual e legendas
Descubra as novas melhorias do Gemini Live: busca visual e controles de legendas!. (Imagem/Reprodução: Androidauthority)
Resumo da notícia
    • Futuras versões do Gemini Live podem incluir busca visual com a função Circle to Search.
    • Controles de legendas estão sendo considerados na interface do assistente de IA do Google.
    • Essas melhorias visam melhorar a usabilidade e acessibilidade do aplicativo para os usuários.
    • Proteções dos recursos ainda estão em testes e podem ser lançados futuramente.
CONTINUA DEPOIS DA PUBLICIDADE

O Google está trabalhando para integrar ainda mais ferramentas no Gemini Live, seu assistente de inteligência artificial. Novidades recentes indicam que uma nova interface compacta, em formato de barra na parte inferior da tela, pode trazer a função Circle to Search do Gemini, permitindo buscas visuais diretamente do aplicativo. Controles de legendagem também estão sendo considerados.

Recursos Aprimorados e a Nova Interface Compacta do Gemini Live

O Google tem focado intensamente no desenvolvimento de Gemini Live, e essa evolução não se limita apenas às novas extensões que foram descobertas. Há meses, a equipe tem trabalhado em diversas frentes, incluindo o aprimoramento da interação com a tela do dispositivo, inspirada no conceito de busca visual, além de implementar uma nova e compacta interface de sobreposição.

Essas descobertas são baseadas em uma análise de APK teardown, que é um processo de examinar o código de um aplicativo Android para prever futuras funcionalidades ainda em desenvolvimento. No caso, foi a versão beta 16.25.44.sa.arm64 do aplicativo Google para Android que revelou os detalhes sobre essas implementações. É importante lembrar que recursos encontrados em teardowns nem sempre chegam à versão pública, pois podem ser protótipos ou projetos descartados.

CONTINUA DEPOIS DA PUBLICIDADE

Embora a marca Circle to Search ainda não apareça diretamente em Live (uma aparição anterior mencionava “Circle Screen“), a funcionalidade parece ser a mesma. Em testes iniciais, uma interface provisória foi observada na forma de um botão de ação flutuante (FAB) com um ícone de caneta, indicando a intenção do recurso de busca visual. Essa primeira abordagem, contudo, parecia um pouco desajeitada e não tão integrada visualmente ao restante do sistema.

No entanto, a nova interface que o Google está explorando atualmente aparenta ser mais coesa e fazer mais sentido no contexto de uma ferramenta de IA. Conseguimos ativá-la com uma das versões da sobreposição em desenvolvimento, onde sua presença se encaixa melhor no design geral do aplicativo. Ao selecionar essa opção de busca visual, o comportamento é mais refinado, com o ícone sendo destacado de forma clara e intuitiva. Essa evolução na busca visual reforça o compromisso do Google em aprimorar a experiência do usuário, tornando-a mais fluida e prática para o dia a dia.

Controles de Legendas no Gemini Live

Outra funcionalidade que chamou a atenção no desenvolvimento é a adição de um botão para ativar legendas, posicionado logo acima da sobreposição compacta de Gemini Live. A localização desse botão pode parecer um pouco estranha à primeira vista, pois o ideal seria que estivesse na mesma barra junto com os outros controles. No entanto, o espaço na interface está ficando um pouco apertado devido à adição de diversas novas funções.

Apesar do posicionamento, a funcionalidade das legendas opera conforme o esperado. Uma vez que elas são ativadas em Gemini Live, permanecem visíveis mesmo se a sobreposição e o botão de legendas forem minimizados na tela. Esse comportamento garante a continuidade da informação, o que é um ponto positivo, especialmente para recursos de acessibilidade, pois não interrompe a leitura ou acompanhamento de conteúdo.

Se o Google conseguir encontrar um lugar mais estratégico para esse controle dentro da barra de sobreposição, a funcionalidade de legendagem estará em boa forma para o lançamento público. A integração com aplicativos Android é um passo importante para levar o Gemini Live a um público mais amplo e funcional, tornando-o acessível em diversas situações.

Essas adaptações na interface demonstram que o Google está atento aos detalhes de usabilidade, mesmo em estágios iniciais de desenvolvimento. A intenção é entregar uma experiência completa e prática, facilitando o acesso a ferramentas importantes de inteligência artificial de maneira intuitiva para os usuários de dispositivos móveis.

O Futuro Próximo de Gemini Live

CONTINUA DEPOIS DA PUBLICIDADE

Atualmente, é importante notar que nenhuma dessas alterações, seja a nova interface para busca visual ou os controles de legendagem, está disponível para o público geral de usuários Android. Elas representam um vislumbre do que está sendo desenvolvido internamente pelos engenheiros do Google, um trabalho contínuo para refinar o assistente de IA.

No entanto, esses achados, revelados por meio das análises de código, oferecem uma visão clara da direção que o Gemini Live pode tomar no futuro. Isso indica que o Google pretende seguir com o desenvolvimento e eventual lançamento dessas funcionalidades para todos os usuários, aprimorando a interação com seus dispositivos de forma significativa.

O Google continua a trabalhar intensamente em seus modelos de inteligência artificial, e novas versões já estão chegando para celulares Samsung no Brasil. Ações agendadas no Gemini também já mostram como a inteligência artificial pode ajudar na organização diária dos usuários. Estes aprimoramentos demonstram o investimento contínuo da empresa em recursos de inteligência artificial e sua aplicação em diversos contextos para facilitar a vida das pessoas.

A inteligência artificial tem sido uma área de constante evolução e inovação, e a presença de recursos como os encontrados no Gemini Live apenas reitera essa tendência tecnológica. Recursos de inteligência artificial já estão presentes em outros softwares e plataformas, mostrando a amplitude de sua aplicação e o potencial de transformação digital que ela oferece.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.