Google I/O 2024: tudo anunciado até agora
Chegou aquele momento que você esperou o ano todo: o dia da palestra do Google I/O! O Google inicia sua conferência de desenvolvedores todos os anos com um fluxo rápido de anúncios, incluindo muitas revelações de coisas recentes nas quais está trabalhando. Brian já nos expulsou compartilhando o que esperamos.
Sabemos que você nem sempre tem tempo para assistir toda a apresentação de duas horas hoje, então estamos assumindo isso e entregaremos acessos rápidos das maiores notícias da palestra à medida que forem anunciadas, tudo em uma lista fácil de digerir e ler. Aqui vamos nós!
Atualizações da Gema 2
Gemma 2, a próxima geração de modelos Gemma do Google, será lançada com um modelo de 27 bilhões de parâmetros em junho. Um dos principais pedidos que o Google ouviu dos desenvolvedores é por um modelo Gemma maior, mas ainda precisa caber no tamanho. O Google está adicionando um novo modelo de 27 bilhões de parâmetros ao Gemma 2. Este tamanho é otimizado pela Nvidia para rodar em GPU de próxima geração e pode rodar com eficiência em um único host TPU e vértice AI, disse o Google. Consulte Mais informação
Google Play
O Google Play está recebendo atenção com um novo recurso de descoberta para aplicativos, novas maneiras de adquirir usuários, atualizações para Play Points e outras melhorias em ferramentas voltadas para desenvolvedores, como o Google Play SDK Console e a API Play Integrity, entre outras coisas.
De particular interesse para os desenvolvedores é algo chamado Engage SDK, que apresentará uma maneira para os fabricantes de aplicativos mostrarem seu conteúdo aos usuários em uma experiência imersiva em tela inteira, personalizada para cada usuário. O Google diz que esta não é uma superfície que os usuários possam ver no momento. Consulte Mais informação
Detectando golpes durante chamadas
Terça-feira, o Google apresentou uma prévia de um recurso que acredita alertará os usuários sobre possíveis golpes durante a ligação.
O recurso, que será integrado em uma versão futura do Android, utiliza Gemini Nano, a menor versão da oferta de IA generativa do Google, que pode ser executada inteiramente no dispositivo. O sistema escuta efetivamente “padrões de conversa comumente associados a golpes” em tempo real.
O Google dá o exemplo de alguém que se faz passar por “representante do banco”. Táticas comuns de golpistas, como solicitações de senha e cartões-presente, também acionarão o sistema. Todas essas são formas de extrair dinheiro de você, mas muitas pessoas no mundo ainda estão vulneráveis a esse tipo de golpe. Uma vez acionado, aparecerá uma notificação de que o usuário pode estar sendo vítima de personagens desagradáveis. Consulte Mais informação
Pergunte fotos
O Google Fotos está recebendo uma infusão de IA com o lançamento de um recurso experimental, Ask Photos, desenvolvido pelo modelo Gemini AI do Google. A nova adição, que será lançada ainda neste verão, permitirá aos usuários pesquisar em sua coleção do Google Fotos usando consultas em linguagem natural que aproveitam a compreensão da IA sobre o conteúdo de suas fotos e outros metadados.
Embora antes os usuários pudessem pesquisar pessoas, lugares ou coisas específicas em suas fotos, graças ao processamento de linguagem natural, a atualização da IA tornará a localização do conteúdo certo mais intuitiva e menos um processo de pesquisa manual.
E o exemplo também foi fofo. Quem não ama uma dupla de animais de pelúcia de tigre e banda Golden Retriever chamada “Golden Stripes?” Consulte Mais informação
Tudo sobre Gêmeos
Gêmeos no Gmail: os usuários do Gmail poderão pesquisar, resumir e redigir seus e-mails usando a tecnologia Gemini AI. Ele também poderá atuar em e-mails para tarefas mais complexas, como ajudá-lo a processar uma devolução de comércio eletrônico pesquisando sua caixa de entrada, encontrando o recibo e preenchendo um formulário online. Consulte Mais informação
Gêmeos 1.5 Pró: Outra atualização da IA generativa é que o Gemini agora pode analisar documentos, bases de código, vídeos e gravações de áudio mais longos do que antes.
Em uma prévia privada de uma nova versão do Gemini 1.5 Pro, o atual modelo carro-chefe da empresa, foi revelado que ele pode receber até 2 milhões de tokens. Isso é o dobro do valor máximo anterior. Com esse nível, a nova versão do Gemini 1.5 Pro suporta a maior entrada de qualquer modelo disponível comercialmente. Consulte Mais informação
Gêmeos ao vivo: A empresa apresentou uma nova experiência no Gemini chamada Gemini Live, que permite aos usuários ter bate-papos de voz “aprofundados” com o Gemini em seus smartphones. Os usuários podem interromper o Gemini enquanto o chatbot fala para fazer perguntas esclarecedoras, e ele se adaptará aos seus padrões de fala em tempo real. E o Gemini pode ver e responder ao ambiente dos usuários, seja por meio de fotos ou vídeos capturados pelas câmeras de seus smartphones.
À primeira vista, o Live não parece uma atualização drástica em relação à tecnologia existente. Mas o Google afirma que utiliza técnicas mais recentes do campo de IA generativa para fornecer análises de imagens superiores e menos propensas a erros – e combina essas técnicas com um mecanismo de fala aprimorado para um diálogo multivoltas mais consistente, emocionalmente expressivo e realista. Consulte Mais informação
Gêmeos Nano: Agora, um pequeno anúncio. O Google também está construindo o Gemini Nano, o menor de seus modelos de IA, diretamente no cliente de desktop Chrome, começando com o Chrome 126. Isso, diz a empresa, permitirá que os desenvolvedores usem o modelo no dispositivo para potencializar seus próprios recursos de IA. O próprio Google planeja usar esse novo recurso para potencializar recursos como a ferramenta existente “ajude-me a escrever” do Workspace Lab no Gmail, por exemplo. Consulte Mais informação
Gêmeos no Android: O Gemini do Google no Android, seu substituto de IA para o Google Assistant, em breve aproveitará sua capacidade de integração profunda com o sistema operacional móvel do Android e os aplicativos do Google. Os usuários poderão arrastar e soltar imagens geradas por IA diretamente no Gmail, no Google Mensagens e em outros aplicativos. Enquanto isso, os usuários do YouTube poderão tocar em “Perguntar a este vídeo” para encontrar informações específicas daquele vídeo do YouTube, diz o Google. Consulte Mais informação
Gêmeos no Google Maps: Os recursos do modelo Gemini estão chegando à plataforma Google Maps para desenvolvedores, começando com a API Places. Os desenvolvedores podem mostrar resumos generativos de IA de lugares e áreas em seus próprios aplicativos e sites. Os resumos são criados com base na análise de insights da comunidade do Google Maps de mais de 300 milhões de colaboradores do Gemini. O que é melhor? Os desenvolvedores não precisarão mais escrever suas próprias descrições personalizadas de lugares. Consulte Mais informação
Unidades de processamento tensor obtêm um aumento de desempenho
O Google revelou sua próxima geração – a sexta para ser exato – de seus chips de IA Tensor Processing Units (TPU). Chamados de Trillium, eles serão lançados ainda este ano. Se você se lembra, anunciar a próxima geração de TPUs é uma tradição na I/O, mesmo que os chips só sejam lançados no final do ano.
Essas novas TPUs apresentarão um aumento de desempenho de 4,7x no desempenho computacional por chip em comparação com a quinta geração. O que talvez seja ainda mais importante, porém, é que o Trillium apresenta a terceira geração do SparseCore, que o Google descreve como “um acelerador especializado para processar embeddings ultragrandes, comuns em classificações avançadas e cargas de trabalho de recomendação”. Consulte Mais informação
IA em pesquisa
O Google está adicionando mais IA à sua busca, dissipando as dúvidas de que a empresa esteja perdendo participação de mercado para concorrentes como ChatGPT e Perplexity. Ela está lançando visões gerais baseadas em IA para usuários nos EUA. Além disso, a empresa também pretende usar o Gemini como agente para coisas como planejamento de viagens. Consulte Mais informação
O Google planeja usar IA generativa para organizar toda a página de resultados de pesquisa para alguns resultados de pesquisa. Isso é um acréscimo ao recurso AI Overview existente, que cria um pequeno trecho com informações agregadas sobre um tópico que você estava procurando. O recurso AI Overview estará disponível na terça-feira, após uma passagem pelo programa AI Labs do Google. Consulte Mais informação
Atualizações generativas de IA
O Google anunciou o Imagen 3, o mais recente da família de modelos de IA generativa Imagen da gigante da tecnologia.
Demis Hassabis, chefe da DeepMind, divisão de pesquisa de IA do Google, disse que o Imagen 3 entende com mais precisão os prompts de texto que traduz em imagens em comparação com seu antecessor, Imagen 2, e é mais “criativo e detalhado” em suas gerações. Além disso, o modelo produz menos “artefatos que distraem” e erros, disse ele.
“Este é (também) o nosso melhor modelo para renderização de texto, o que tem sido um desafio para os modelos de geração de imagens”, acrescentou Hassabis. Consulte Mais informação
Projeto IDX
O Projeto IDX, o ambiente de desenvolvimento de próxima geração baseado em navegador centrado em IA da empresa, está agora em beta aberto. Com esta atualização vem uma integração com a plataforma Google Maps no IDE, ajudando a adicionar recursos de geolocalização aos seus aplicativos, bem como integrações com o Chrome Dev Tools e Lighthouse para ajudar a depurar aplicativos. Em breve, o Google também permitirá a implantação de aplicativos no Cloud Run, a plataforma sem servidor do Google Cloud para execução de serviços front-end e back-end. Consulte Mais informação
Eu vejo
O Google está buscando o Sora da OpenAI com Veo, um modelo de IA que pode criar videoclipes em 1080p com cerca de um minuto de duração, a partir de um prompt de texto. Veo pode capturar diferentes estilos visuais e cinematográficos, incluindo fotos de paisagens e timelapses, e fazer edições e ajustes em imagens já geradas.
Ele também se baseia no trabalho comercial preliminar do Google em geração de vídeo, apresentado em abril, que aproveitou a família Imagen 2 de modelos de geração de imagens da empresa para criar videoclipes em loop. Consulte Mais informação
Circule para pesquisar
O recurso Circle to Search com tecnologia de IA, que permite aos usuários do Android obter respostas instantâneas usando gestos como circular, agora será capaz de resolver problemas mais complexos em problemas psíquicos e matemáticos. Ele foi projetado para tornar mais natural o envolvimento com a Pesquisa Google de qualquer lugar do telefone, realizando alguma ação, como circular, destacar, rabiscar ou tocar. Ah, e também é melhor ajudar as crianças com os deveres de casa diretamente de telefones e tablets Android compatíveis. Consulte Mais informação
Genkit do Firebase
Há uma nova adição à plataforma Firebase, chamada Firebase Genkit, que visa tornar mais fácil para os desenvolvedores construir aplicativos baseados em IA em JavaScript/TypeScript, com suporte para Go em breve. É uma estrutura de código aberto, usando a licença Apache 2.0, que permite aos desenvolvedores construir rapidamente IA em aplicativos novos e existentes.
Alguns dos casos de uso do Genkit que a empresa destaca na terça-feira incluem muitos dos casos de uso padrão do GenAI: geração e resumo de conteúdo, tradução de texto e geração de imagens. Consulte Mais informação
Pixel 8a
O Google mal podia esperar até o I/O para mostrar a última adição à linha Pixel e anunciou o novo Pixel 8a na semana passada. O aparelho custa a partir de US$ 499 e é enviado na terça-feira. As atualizações também são o que esperamos dessas atualizações. No topo da lista está a adição do chip Tensor G3. Consulte Mais informação
Ardósia de pixels
O Pixel Tablet do Google, chamado Slate, já está disponível. Se você se lembra, Brian revisou o Pixel Tablet mais ou menos na mesma época do ano passado, e tudo o que ele falou foi sobre a base. Curiosamente, o tablet está disponível sem ele. Consulte Mais informação
Estaremos atualizando este post ao longo do dia…