前回の記事では、RAG(Retrieval Augmented Generation)の基本的な概念と医療分野での具体的な活用例について解説しました。今回は、RAGのプロセスを詳しく見ていき、プロンプトとクエリの違いを具体例と画像を用いて説明します。
RAGの基本的な復習
RAGは、情報検索(Retrieval)と生成(Generation)を統合したAI技術です。まず、ユーザーの入力(プロンプト)に基づいて関連情報を検索し(Retrieval)、その情報を基に新しいコンテンツを生成します(Generation)。このプロセスにより、より正確で関連性の高い情報提供が可能となります。
初心者でもわかるRAG(Retrieval Augmented Generation)とは?医療分野での活用例も紹介 | デイリーライフAI (daily-life-ai.com)
RAGのプロセスを図で理解する
下の画像は、RAGのプロセスを視覚的に示したものです。

この図は、RAGがどのように機能するかを5つのステップに分けて説明しています。
- プロンプト + クエリの入力
- ユーザーがプロンプトとクエリを入力します。(通常、ユーザーはプロンプトのみを入力し、クエリはAIが自動的に生成します。)
- 例:医師が「50歳の男性患者が最近胸の痛みを訴えている。以前に高血圧の診断を受けており、家族歴に心臓病がある。最も可能性のある診断と推奨される検査は何か?」というプロンプトを入力します。
- クエリの生成と送信
- AIはプロンプトを基にクエリを生成し、それを基に関連するドキュメントを検索します。
- 例:「高血圧と胸の痛み」、「50歳男性の胸の痛みと心臓病のリスク」、「家族歴に心臓病がある場合の胸の痛み」といったクエリが生成され、外部データベースに送信されます。
- 取得(Retrieval)されたドキュメント
- クエリに基づいて、関連するドキュメントが外部データベースから検索され、取得されます。
- 例:医学論文やガイドラインが検索され、取得されます。
- プロンプト + クエリ + 取得されたドキュメントの統合
- 取得されたドキュメントがプロンプトとクエリと共に大規模言語モデル(LLM)に送られます。
- これにより、文脈に基づいた回答生成が可能となります。
- 最終的な回答の生成
- 大規模言語モデル(LLM)が統合された情報を基に最終的な回答を生成します。
- 例:診断結果や推奨される検査が具体的に示されます。
プロンプトとクエリの違い
プロンプトはユーザーがAIに提供する文脈や指示で、AIが生成する内容の方向性を決定します。
一方、クエリは関連情報を検索するための具体的な質問やキーワードです。
具体例を用いた説明:
- プロンプトの例: 「50歳の男性患者が最近胸の痛みを訴えている。以前に高血圧の診断を受けており、家族歴に心臓病がある。最も可能性のある診断と推奨される検査は何か?」
- これはAIが生成する内容の方向性を示します。
- クエリの例: 「高血圧と胸の痛み」、「50歳男性の胸の痛みと心臓病のリスク」、「家族歴に心臓病がある場合の胸の痛み」
- これはAIが外部データベースから関連情報を検索するために使用されます。
まとめ
RAGは、プロンプトとクエリを効果的に連携させることで、精度の高い情報提供を実現します。特に医療分野では、患者の病歴や最新の研究データを基にした診断支援が可能となり、医療従事者の負担を軽減し、患者にとって最適な治療を提供する手助けとなります。
このプロセスを理解することで、RAGの強力な機能を最大限に活用し、さまざまな分野での応用可能性を広げることができます。
コメント