RAG アプリケーションのドキュメントを最適化することが重要なのはなぜですか?RAG のパフォーマンスを妨げる可能性のある raw ドキュメントの一般的な課題は何ですか?見出しとサブ見出しを使用すると、どのように RAG のパフォーマンスを向上させることができますか?テーブル情報をフラットレベルの構文に置き換えることが推奨されるのはなぜですか?概要を追加すると、RAG のパフォーマンスを向上させるにはどうすればよいですか?LLMs の略語を定義し、コンテキストを設定することが重要なのはなぜですか?

よくある質問

RAG アプリケーションのドキュメントを最適化することが重要なのはなぜですか?

Raw ドキュメントは、多くの場合、検索拡張生成 (RAG) アプリケーションなどの高度な AI システムの要件を考慮せずに、人間が使用するために記述されます。ベストプラクティスに従ってドキュメントを最適化すると、モデルに構造化され、あいまいで、関連情報を提供することで、RAG アプリケーションのパフォーマンスと精度が大幅に向上します。

RAG のパフォーマンスを妨げる可能性のある raw ドキュメントの一般的な課題は何ですか?

主な課題には、構造化されたフォーマットとメタデータの欠如、非公式または一貫性のない言語、冗長性と冗長性、あいまいな用語とフレーズ、ハイパーリンク要素の包含、ドメイン固有のコンテキストの欠如などがあります。これらの問題は、RAG モデルを混乱させ、不正確または無関係な応答につながる可能性があります。詳細については、このガイドの「RAG アプリケーションに影響するソースデータの課題」を参照してください。

見出しとサブ見出しを使用すると、どのように RAG のパフォーマンスを向上させることができますか?

明確な見出しとサブ見出しは、RAG モデルがコンテンツの構造とコンテキストを理解するのに役立ちます。これにより、ドキュメントをより適切にナビゲートして関連情報を抽出し、生成されたレスポンスの品質を向上させることができます。詳細については、このガイドの「RAG アプリケーションのドキュメントのベストプラクティス」を参照してください。

テーブル情報をフラットレベルの構文に置き換えることが推奨されるのはなぜですか?

RAG モデルは 2 次元構造を理解する必要があるため、テーブルを解釈するのは難しい場合があります。フラットレベルの構文または箇条書きリストでテーブル情報を表示すると、モデルが情報をより簡単に処理できるため、パフォーマンスが向上します。詳細については、このガイドの「RAG アプリケーションのドキュメントのベストプラクティス」を参照してください。

概要を追加すると、RAG のパフォーマンスを向上させるにはどうすればよいですか?

各セクションまたはサブセクションの先頭に簡潔な概要を含めると、セマンティックカバレッジが向上し、重要なポイントが強化される可能性があります。これにより、埋め込みスペース内の類似度検索の精度が向上し、最終的に RAG アプリケーションのパフォーマンスが向上します。詳細については、このガイドの「RAG アプリケーションのドキュメントのベストプラクティス」を参照してください。

LLMs の略語を定義し、コンテキストを設定することが重要なのはなぜですか?

LLMs は幅広いデータに基づいてトレーニングされていますが、企業固有の略語や用語のコンテキストがありません。略語の定義とコンテキストの提供はLLMs がより正確に理解し、応答するのに役立ちます。これにより、幻覚や誤解を防ぐことができます。詳細については、このガイドの「RAG アプリケーションのドキュメントのベストプラクティス」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ベストプラクティス

次のステップとリソース