翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
生成 AI アプリケーションのデータセキュリティ、ライフサイクル、戦略
Romain Vivier、Amazon Web Services
2025 年 7 月 (ドキュメント履歴)
生成 AI はエンタープライズ環境を変革しています。これにより、これまでにないレベルのイノベーション、自動化、競争上の差別化が可能になります。ただし、その可能性を最大限に引き出す能力は、強力なモデルだけでなく、強力で目的意識の高いデータ戦略にも依存します。このガイドでは、生成 AI イニシアチブで発生するデータ固有の課題について説明し、それらを克服して有意義なビジネス成果を達成する方法について明確な方向性を示します。
生成 AI がもたらす最も基本的な変化の 1 つは、大量の非構造化およびマルチモーダルデータへの依存です。従来の機械学習は、通常、構造化されたラベル付きデータセットに依存します。ただし、生成 AI システムは、ラベルが付いておらず、高度に可変であることが多いテキスト、画像、オーディオ、コード、動画から学習します。したがって、組織は従来のデータ戦略を再評価して拡張し、これらの新しいデータ型を含める必要があります。これにより、手動入力への依存を減らしながら、コンテキスト対応のアプリケーションを作成し、ユーザーエクスペリエンスを向上させ、生産性を高め、コンテンツ生成を高速化できます。
このガイドでは、効果的な生成 AI デプロイをサポートする完全なデータライフサイクルの概要を説明します。これには、大規模なデータセットの準備とクレンジング、モデルのコンテキストを最新の状態に保つための検索拡張生成 (RAG) パイプラインの実装、ドメイン固有のデータの微調整、継続的なフィードバックループの確立が含まれます。これらのアクティビティを正しく完了すると、モデルのパフォーマンスと関連性が向上します。また、AI ユースケースの迅速な提供、意思決定のサポートの向上、運用効率の向上を通じて、具体的なビジネス価値を提供します。
セキュリティとガバナンスは、成功の重要な柱として提示されます。このガイドでは、機密情報の保護、アクセスコントロールの適用、リスク (幻覚、データポイズニング、攻撃者攻撃など) への対応を支援する方法について説明します。生成 AI ワークフローに堅牢なガバナンスとモニタリングのプラクティスを組み込むことで、規制コンプライアンス要件をサポートし、企業の評判を保護し、AI システムに対する社内外の信頼を構築できます。また、データに関連するエージェント AI の課題について説明し、エージェントベースのシステムにおける ID 管理、トレーサビリティ、堅牢なセキュリティの必要性についても説明します。
このガイドでは、データ戦略を、ビジョン、実験、起動、スケールといった生成 AI 導入の各フェーズにも結び付けます。このモデルの詳細については、「生成 AI を採用するための成熟度モデル AWS」を参照してください。各段階で、組織はデータインフラストラクチャ、ガバナンスモデル、運用準備状況をビジネス目標に合わせる必要があります。この調整により、本番稼働への道が速くなり、リスクを軽減し、生成 AI ソリューションが企業全体で責任を持って持続的にスケールできるようになります。
要約すると、堅牢なデータ戦略は、生成 AI を成功させるための前提条件です。データを戦略的アセットとして扱い、ガバナンス、品質、セキュリティに投資する組織は、生成 AI を自信を持ってデプロイするうえで有利です。実験から企業全体の変革に迅速に移行し、カスタマーエクスペリエンスの向上、運用効率、長期的な競争上の優位性など、測定可能な成果を達成できます。
対象者
このガイドは、生成 AI の堅牢でスケーラブルなデータ戦略を構築して運用したい企業リーダー、データプロフェッショナル、テクノロジーの意思決定者を対象としています。 このガイドの推奨事項は、生成 AI ジャーニーに乗り出す、または前進する企業に適しています。データ戦略、ガバナンス、セキュリティフレームワークを調整して、生成 AI のビジネス価値と利点を最大化するのに役立ちます。このガイドの概念と推奨事項を理解するには、基本的な AI とデータの概念に精通し、エンタープライズ IT ガバナンスとコンプライアンスの基本に精通している必要があります。
目的
このガイドの推奨事項に従ってデータ戦略を変更すると、次の利点があります。
-
従来の ML と生成 AI でデータ要件とプラクティスがどのように異なるかを理解し、これらの違いがエンタープライズデータ戦略にとって何を意味するかを理解します。
-
従来の ML の構造化されたラベル付きデータと、生成 AI を促進する非構造化のマルチモーダルデータの違いを理解します。
-
確立された ML プラクティスを超えて、生成 AI モデルがデータの準備、統合、ガバナンスに新しいアプローチを必要とする理由を理解してください。
-
生成 AI によるデータ合成が、より従来の ML ユースケースを加速する方法について説明します。