Gemini 1.5 Flash-8B 现在可投入使用

十月 03, 2024

Logan Kilpatrick Senior Product Manager Gemini API and Google AI Studio

Shrestha Basu Mallick Group Product Manager Gemini API

如今，我们最新款的 Gemini 1.5 Flash-8B 模型可投入使用，并具备以下优势：

价格降低 50%（与 1.5 Flash 相比）

速率限制提高 1 倍（与 1.5 Flash 相比）

处理小规模提示的延迟更低（与 1.5 Flash 相比）

开发者可以通过 Google AI Studio 和 Gemini API 免费访问 gemini-1.5-flash-8b。

我们的轻量级模型，尺寸更小、速度更快

在 I/O 大会上，我们宣布推出针对速度和效率进行了优化的轻量级模型 Gemini 1.5 Flash。在过去的几个月里，Google DeepMind 在根据开发者反馈和极限测试结果优化 1.5 Flash 方面取得了相当大的进展。

上个月，我们发布了 Gemini 1.5 Flash-8B 的实验性版本，该模型比 1.5 Flash 模型更小，但速度更快。我们现在很高兴能够将其正式投入使用。在许多基准测试中，Flash-8B 几乎与 5 月推出的 1.5 Flash 模型的性能相当。Flash-8B 在聊天、转录和长上下文语言翻译等任务上表现尤为出色。

为了发布一流的小模型，我们需要继续从开发者的反馈和我们自己对这些模型蕴藏的潜力进行的测试中获取信息。我们认为，该模型最适合处理的任务包括大量多模态用例到长上下文摘要任务等。