GA do Gemini 1.5 Pro e 1.5 Flash, suporte a ajustes no 1.5 Flash, limites de utilização mais altos e outras atualizações de API

MAI 30, 2024
Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio
Shrestha Basu Mallick Group Product Manager Gemini API

Editor’s note: The post has been updated to reflect that 1.5 Flash tuning support has been delayed a few weeks and will not launch on June 17.

Para aproveitar o Google I/O, estamos anunciando atualizações importantes para a API Gemini e o Google AI Studio, incluindo:

  • Versão estável do Gemini 1.5 Flash e 1.5 Pro e faturamento

  • Limites de utilização mais altos no Gemini 1.5 Flash

  • Ajustes no Gemini 1.5 Flash

  • Modo de esquema JSON

  • Modo claro e suporte a dispositivos móveis no Google AI Studio

Estamos muito animados para ver o que você vai criar com esses novos modelos e comprometidos em fornecer uma experiência de desenvolvimento de primeira classe. Você pode começar com o Gemini 1.5 Flash e o 1.5 Pro sem custo financeiro no Google AI Studio.


Atualizações do Gemini 1.5 Flash

O Gemini 1.5 Flash foi desenvolvido especificamente para ser nosso modelo mais rápido e econômico para tarefas de alto volume, em escala, como resposta ao feedback dos desenvolvedores, que desejavam uma latência e um custo menores. Hoje, estamos aumentando o limite de utilização do 1.5 Flash para 1.000 solicitações por minuto (RPMs, na sigla em inglês) e removendo o limite de solicitações por dia. O limite de utilização do 1.5 Pro não será alterado neste momento, mas se você precisar de limites ainda mais altos para escalonamento ou tiver algum feedback, entre em contato conosco.

Customizing models can help you reach the performance threshold needed to take AI models into production. To support that, we will also be rolling out tuning support for Gemini 1.5 Flash in the coming weeks. Tuning will be supported in both Google AI Studio and the Gemini API directly. Currently, tuning jobs are free of charge, and using a tuned model does not incur any additional per-token costs. You can learn more about tuning in the Gemini API docs.


Faturamento da API Gemini

Além do nível gratuito, a partir de hoje, os desenvolvedores podem desbloquear limites mais altos de utilização de API ativando uma conta de faturamento no Google AI Studio.

Configure o faturamento no Google AI Studio

Você pode saber mais sobre os preços do modelo Gemini 1.5 em ai.google.dev/pricing. Se tiver problemas para configurar o faturamento, informe-nos em nosso fórum de desenvolvedores. Para desenvolvedores que desejam fazer o escalonamento com recursos de nível empresarial, os mesmos modelos estão disponíveis via Vertex AI, nossa plataforma empresarial de IA.


Modo de esquema JSON

Lançamos o modo JSON na API Gemini e no Google AI Studio no início deste ano para oferecer mais controle sobre a saída do modelo. A partir de hoje, você pode especificar o esquema JSON desejado para a resposta do modelo, o que desbloqueia muitos casos de uso novos nos quais você precisa que o modelo esteja em conformidade com certas restrições de saída, como para seguir uma estrutura predefinida ou gerar a saída apenas de textos específicos. Você pode ler mais sobre o modo de esquema JSON nos documentos da API Gemini.


Modo claro e suporte a dispositivos móveis

Para dar aos desenvolvedores mais flexibilidade no AI Studio, agora você pode escolher seu modo de IU preferido (claro ou escuro) ou usar os padrões do sistema no painel de configurações. Também lançamos nosso primeiro conjunto de melhorias para dispositivos móveis para o Google AI Studio a fim de permitir que você teste prompts multimodais rapidamente e em qualquer lugar.


Enquanto continuamos melhorando a experiência para os desenvolvedores, compartilhe seu feedback no fórum de desenvolvedores. Agora é só partir para a diversão e começar a programar!