Gemini File Search StoreでRAG APIを構築する
はじめに
Gemini APIでナレッジデータベースを組み込んだシステムを作りたい。
でも、APIに毎回膨大なナレッジを送るのは現実的ではありません。
そんな課題を解決するサービスがGoogleから出ていました。
今回は、Gemini File Search Storeを使ってRAG APIを構築した事例を紹介します。
解決したかった問題
私は塾講師として、大学受験の英作文指導を行っています。
生徒が自分で英作文を練習しようとしても、ChatGPTに入れるだけでは入試向けの適切な回答が得られません。
私なら適切なプロンプトを工夫できますが、生徒にそれを求めるのは現実的ではありません。
そこで思いついたのが、プロンプトを意識せずに使える、大学受験特化の添削AIを作ることでした。
必要だったナレッジ
大学受験に特化させるために、以下のようなナレッジを用意しました。
- 大学受験に必要な語彙リスト
- 英作文に頻出の構文集
- 言い換えパターン集
データは揃いました。問題は、これをどうやってAPIに組み込むかです。
Manusで調査したところ、まさにこの用途に適したサービスが見つかりました。
Gemini File Search Storeとは
Googleが2025年11月にリリースした、フルマネージドRAGシステムです。
そもそもRAGとは
RAG(Retrieval-Augmented Generation)とは、AIに外部の知識を参照させる仕組みです。
通常、AIは学習済みの知識しか持っていません。しかしRAGを使えば、自分で用意したドキュメントやデータベースの内容を踏まえた回答を生成させることができます。
今回の例でいえば、大学受験用の語彙リストや構文集をAIに参照させることで、入試に特化した添削が可能になります。
従来のRAG構築は大変だった
RAGを自分で構築するには、以下のような作業が必要でした。
- チャンキング:ドキュメントを適切なサイズに分割する
- Embedding:テキストを数値ベクトルに変換する
- ベクトルDB:変換したベクトルを保存・検索するデータベースを構築する
- 検索ロジック:質問に関連する情報を取り出す仕組みを作る
これらをすべて自分で設計・実装するのは、かなりの労力です。
私はいわゆるバイブコーダーで、AIの力を借りながら開発しています。正直なところ、こういった専門的な知識には明るくありません。
File Search Storeならすべて自動
File Search Storeは、これらの面倒な作業をすべて自動化してくれます。
| 項目 | 従来のRAG | File Search Store |
|---|---|---|
| チャンキング | 自分で実装 | 自動 |
| Embedding | 選定・実行が必要 | 自動 |
| ベクトルDB | 構築・運用が必要 | 自動 |
| 検索ロジック | 自分で実装 | 自動 |
ファイルをアップロードするだけで、RAGが完成します。
主な特徴
- シンプルなAPI:ファイルをアップロードするだけでRAGが完成
- 自動引用:回答に使用したドキュメント箇所を自動で引用表示
- セマンティック検索:完全一致でなくても意味的に関連する情報を検索
- 多様なファイル形式:PDF、DOCX、TXT、JSON、プログラミング言語ファイル等に対応
料金
料金体系も魅力的です。
- ストレージ:無料
- クエリ時のEmbedding生成:無料
- 初回インデックス作成のみ課金:$0.15 / 100万トークン
実質的に、初回のインデックス作成時のみコストがかかる設計です。
完成したもの
こうして完成したのが、大学受験英作AIです。
もともとは自分の業務で使うために作りましたが、開発の勉強にもなりました。
入力された英文を、大学受験の観点から添削・採点してくれます。
おわりに
Gemini File Search Storeを使えば、複雑なRAGシステムを簡単に構築できます。
APIでナレッジを組み込みたいと考えている方の参考になれば幸いです。