Google Cloud では、エンタープライズ クラスのスケーリング、セキュリティ、オブザーバビリティを備えた生成 AI アプリケーションの構築に使用できる、さまざまなプロダクトとツールを提供しています。

このページでは、生成 AI アプリケーションの開発段階、ユースケースに最適なプロダクトとツールを選択する方法、最初に必要なドキュメントについて説明します。

生成 AI 開発の基礎を学ぶ

生成 AI アプリケーションの開発方法について説明します。
生成 AI の一般的なユースケースとモデルタイプについて説明します。
生成 AI、従来の AI、またはその両方の組み合わせのいずれが、お客様のビジネス ユースケースに適しているかを判断します。
生成 AI アプリケーション開発の各段階における課題への対処方法について説明します。

生成 AI アプリケーションのインフラストラクチャを選択する

生成 AI アプリケーションの構築に最適なプロダクト、フレームワーク、ツールについて説明します。クラウドでホストされる生成 AI アプリケーションの一般的なコンポーネントには、次のようなものがあります。

  1. アプリケーション ホスティング: アプリケーションをホストするコンピューティング。アプリケーションは、Google Cloud のクライアント ライブラリと SDK を使用して、さまざまな Cloud プロダクトと通信できます。
  2. モデル ホスティング: 生成モデルのスケーラブルで安全なホスティング。
  3. モデル: テキスト、チャット、画像、コード、エンベディング、マルチモーダルの生成モデル。
  4. グラウンディング ソリューション: 検証可能な最新の情報源とモデルの出力を関連付けます。
  5. データベース: アプリケーションのデータを保存します。SQL クエリによってプロンプトを拡張したり、pgvector などの拡張機能を使用してデータをベクトル エンベディングとして保存することで、既存のデータベースをグラウンディング ソリューションとして再利用できます。
  6. ストレージ: 画像、動画、静的ウェブ フロントエンドなどのファイルを保存します。ストレージを未加工のグラウンディング データ(PDF など)として使用することもできます。このデータを後でエンベディングに変換し、ベクトル データベースに保存します。

モデルとそのモデル ホスティング インフラストラクチャ、グラウンディング ソリューション、データベース、ストレージ、アプリケーション ホスティングなど、生成 AI アプリケーションのホスティング インフラストラクチャの概要図。

以降のセクションでは、これらの各コンポーネントについて説明します。この情報を参考にして、試してみる Google Cloud プロダクトを選択してください。

アプリケーション ホスティング インフラストラクチャ

アプリケーション ワークロードをホストして、サービングするプロダクトを選択します。このプロダクトから生成モデルを呼び出します。
アプリケーション ホスティングに適したサービスの選択をユーザーに示すディシジョン ツリー。

以下を使用できます。

モデル ホスティング インフラストラクチャ

Google Cloud では、生成モデルをホストする方法がいくつか用意されています。主力の Vertex AI プラットフォームを使用することも、ホストをカスタマイズして Google Kubernetes Engine に移植し、ホスティングすることもできます。

優先順位と要件に基づいて、モデルに適切なホスティング クラウド サービスを選択するためのディシジョン ツリー。

以下を使用できます。

モデル

Google Cloud では、Vertex AI で最先端の基盤モデルのセット(Gemini など)を提供しています。サードパーティ モデルを Vertex AI Model Garden にデプロイすることも、GKE、Cloud Run、Compute Engine 上のセルフホストにデプロイすることもできます。

テキストまたはコードを生成する Vertex AI サービスを選択するためのディシジョン ツリー。テキスト エンベディング、画像、動画を使用するオプションが示されています。

以下を使用できます。

グラウンディング

モデルから裏付けのある正確なレスポンスを取得するには、生成 AI アプリケーションをリアルタイム データグラウンディングすることをおすすめします。これは、検索拡張生成(RAG)と呼ばれます。

ベクトル データベースの独自のデータでグラウンディングを実装できます。これは、類似性検索などのオペレーションに最適な形式です。Google Cloud は、さまざまなユースケースに対応する複数のベクトル データベース ソリューションを提供しています。

注: Cloud SQL や Firestore などの既存のデータベースにクエリを実行し、モデルのプロンプトで結果を使用することで、従来の(ベクトル以外の)データベースをグラウンディングに使用できます。

ニーズに合わせて適切なベクトル データベース ソリューションを選択するためのディシジョン ツリー。

以下を使用できます。

API によるグラウンディング

多くのオンライン サービスでは、グラウンディングに独自のデータを使用する代わりに(または独自のデータに加えて)、グラウンディング データを取得してモデルのプロンプトを強化するための API が用意されています。
大規模言語モデルを外部システムの API に接続する拡張機能の作成、デプロイ、管理を行います。
生成 AI アプリで使用できる YouTube から Google Scholar までのさまざまなドキュメント ローダAPI インテグレーションについて説明します。
Vertex AI でホストされているモデルを使用している場合は、Vertex AI Search、Google 検索、インライン / インファイル テキストを使用して、モデルのレスポンスを根拠づけることができます。

構築を開始する

開発環境を設定する

Google Cloud で生成 AI アプリケーションを構築するために必要なツールをインストールします。
ローカル開発環境を設定し、Cloud APIs を操作するためのコマンドライン ツール。
IDE に API ドキュメントとサンプルを表示することで、GKE と Cloud Run のローカル開発の効率を上げることができます。
ローカル環境とホストされているワークロードから Google Cloud APIs を認証する方法を説明します。
LangChain は、プロンプトにコンテキストを組み込み、モデルのレスポンスに基づいて対応できるようにする生成 AI アプリ用オープンソース フレームワークです。

プロンプトを設計してモデルを評価する

プロンプトでさまざまなモデルを試す方法について説明します。
テキスト、コード、マルチモーダルなど、さまざまな種類のデータ型に対応するプロンプトを設計する方法について説明します。
Vertex AI Studio でプロンプトを設計、テスト、管理する方法について説明します。
分類、アイディエーション、要約など、さまざまなユースケースに利用できるプロンプトのサンプルを紹介します。
新しいアイデアを生成、開発、伝達するためのプロンプト サンプルを紹介します。
Vertex AI を使用して、指標ベースの評価または比較評価を行います。

コードサンプル

GitHub でサンプルをフォークしてビルドを始めます。

Vertex AI Agent Builder と Firebase を使用して、ウェブベースの質問応答 chatbot を作成する方法について説明します。

初心者 Node.js

Vertex AI で事前トレーニング済みの基盤モデルを呼び出すシンプルな Python Flask アプリケーションを構築する方法について説明します。

初心者 Python

Vertex AI の Gemini、Cloud Run、Streamlit を使用して、マーケティング キャンペーンのアイデアを生成するためのウェブアプリを構築します。

初心者 Python

Vertex AI Search と LangChain を使用して、モデルのプロンプトを検証可能な知識ソースに根拠づける方法について説明します(Google Cloud ホワイトペーパー)。

中級 Python

LLM を使用してリクエスト本文に挿入し、その内容を外部 API に送信する関数呼び出しの実装方法について説明します。

中級 Python

AlloyDB for PostgreSQL と Vertex AI を使用した検索拡張生成のサンプルアプリ。(ブログ投稿Codelab)。

中級 Python

アーキテクチャのガイダンスとジャンプ スタート ソリューション

安全性、効率、復元性、パフォーマンス、費用対効果に優れた生成 AI アプリケーションの推奨事項と例。

このリファレンス アーキテクチャを使用して、Vertex AI と AlloyDB for PostgreSQL を使用した検索拡張生成(RAG)対応の生成 AI アプリケーションを実行するためのインフラストラクチャを設計します。

中級

このリファレンス アーキテクチャを使用して、GKE、Cloud SQL、および Ray、Hugging Face、LangChain などのオープンソース ツールを使用した、検索拡張生成(RAG)対応の生成 AI アプリケーションを実行するインフラストラクチャを設計します。

中級

このドキュメントでは、主要な AI ワークロードと ML ワークロード向けに Google Cloud が備えるさまざまなストレージ オプションをどのように使用し、統合するかについての設計ガイダンスを提供します。

上級者向け

Vertex AI を使用して長いドキュメントをワンクリックで要約するサンプル アプリケーションをデプロイします。

中級

Cloud SQL に保存されたベクトル エンベディングを使用して、チャット アプリケーションからの応答の精度を向上させるワンクリック サンプル アプリケーションをデプロイします。

中級

一連のドキュメントから質問と回答のペアを抽出するワンクリック サンプル アプリケーションと、ドキュメントがアップロードされたときにアプリケーションをトリガーするパイプラインをデプロイします。

中級