翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データ戦略
生成 AI の導入を成功させるには、明確に定義されたデータ戦略が不可欠です。このセクションでは、生成 AI 導入ジャーニーの各段階で、データ戦略がどのように重要な役割を果たしているかについて説明します。また、実装のさまざまな側面における重要な考慮事項についても概説します。生成 AI ジャーニーのステージの詳細については、 AWS 「 規範ガイダンス」の「 で生成 AI を採用するための成熟度モデル AWS」を参照してください。
生成 AI 導入ジャーニーは、次の 4 つの主要な段階にわたる構造化された進行です。
-
ビジョン化 – 組織は生成 AI の概念を探求し、意識を高め、潜在的なユースケースを特定します。
-
実験 – 組織は、実装のための中核的な技術的能力と基礎的なフレームワークを構築しながら、構造化されたパイロットプロジェクトと概念実証を通じて生成 AI の可能性を検証します。
-
起動 — 組織は、堅牢なガバナンス、モニタリング、サポートメカニズムを備えた本番環境対応の生成 AI ソリューションを体系的にデプロイし、セキュリティとコンプライアンスの基準を維持しながら、一貫した価値と運用上の優秀性を提供します。
-
スケール — 組織は、再利用可能なコンポーネント、標準化されたパターン、セルフサービスプラットフォームを通じて企業全体の生成 AI 機能を確立し、自動化されたガバナンスを維持し、イノベーションを促進しながら導入を加速します。
すべての段階で、 は包括的なアプローチ AWS を強調し、戦略をインフラストラクチャへの投資、ガバナンスポリシー、セキュリティフレームワーク、運用上のベストプラクティスと整合させて、責任あるスケーラブルな AI デプロイを促進します。各ステージでは、ビジネス、人材、ガバナンス、プラットフォーム、セキュリティ、運用の 6 つの導入の基本的な柱を連携させる必要があります。これらの柱は、生成 AI のニーズに対応するために AWS Cloud Adoption Framework (AWS CAF)
このセクションでは、以下の成熟モデルステージについて詳しく説明します。
レベル 1: Envision
Envision ステージでは、組織は適切なユースケースを特定し、実装に必要なデータソースをマッピングし、今後の実験フェーズの基本的なセキュリティとデータアクセス要件を確立することで、計画に集中します。
この段階では、導入の柱の調整基準を次に示します。
-
ビジネス – 企業の目標に沿った生成 AI の戦略的ユースケースを特定します。高価値データが存在する場所とそのアクセシビリティを評価します。
-
人材 – 生成 AI の導入におけるデータの重要性についてリーダーシップとステークホルダーを教育することで、データ駆動型の文化を育みます。
-
ガバナンス – コンプライアンス、プライバシーの懸念、および潜在的な倫理的リスクを評価するために、初期データ監査を実施します。AI の透明性と説明責任に関する早期ポリシーを策定します。
-
プラットフォーム – 既存のデータインフラストラクチャを評価し、内部データソースと外部データソースをカタログ化し、生成 AI の実現可能性に関するデータ品質を評価します。
-
セキュリティ – データアクセスのためのアクセスコントロールと最小特権の原則の実装を開始します。生成 AI モデルは、ユーザーがアクセスできる情報のみを取得できることを確認してください。
-
オペレーション – 生成 AI 実験のデータを収集、クリーニング、ラベル付けするための構造化されたアプローチを定義します。データモニタリングの初期フィードバックループを確立します。
レベル 2: 実験
実験フェーズでは、組織は特定されたユースケースの実装をサポートするために、必要なデータの可用性と適合性を検証します。並行して、概念実証での実際のデータの使用をサポートするために、実行可能な最小限のデータガバナンスフレームワークを確立します。選択した基盤モデルを微調整することも、取得拡張生成 (RAG) アプローチと組み合わせてoff-the-shelfモデルを使用することもできます。
この段階では、導入の柱の調整基準を次に示します。
-
ビジネス – パイロットプロジェクトの成功基準を明確に定義し、データの可用性が各ユースケースのニーズを満たすようにします。
-
人材 – データエンジニア、AI スペシャリスト、ドメインエキスパートを含む部門横断的なチームを編成します。このチームは、データ品質とモデルとビジネス要件の整合性を検証する責任があります。
-
ガバナンス – 生成 AI データガバナンスのフレームワークを作成します。少なくとも、フレームワークは規制コンプライアンスと責任ある AI ガイドラインについて議論する必要があります。
-
プラットフォーム – 構造化データパイプラインや非構造化データパイプラインなど、初期段階のデータ統合の取り組みを実装します。RAG 実験用のベクトルデータベースを設定します。
-
セキュリティ – 厳格なデータアクセス許可とコンプライアンスチェックを適用します。モデルトレーニングの前に、PII やその他の機密情報がマスクまたは匿名化されていることを確認してください。
-
オペレーション – 本番リリースを準備するには、品質メトリクスを確立してギャップを特定します。
レベル 3: 起動
起動段階では、生成 AI ソリューションは実験からフルスケールのデプロイに移行します。この時点で、統合は完全に実装され、パフォーマンス、モデルの動作、データ品質を追跡するための堅牢なモニタリングフレームワークが確立されています。データのプライバシー、安全性、規制の遵守をサポートするために、包括的なセキュリティとコンプライアンスの対策を講じています。
この段階では、導入の柱の調整基準を次に示します。
-
ビジネス – 運用効率とビジネス価値を測定します。運用コストとリソースの使用を最適化します。
-
人材 – 生成 AI モデルの管理とモニタリングについて運用チームをトレーニングします。適切なデータキュレーションプロセスを使用します。
-
ガバナンス – 生成 AI データガバナンスのフレームワークを改良します。規制コンプライアンス、モデルバイアス、責任ある AI ガイドラインに対処します。進化する規制への準拠を検証するために、生成 AI データパイプラインの継続的な監査を確立します。
-
プラットフォーム – スケーラブルなインフラストラクチャを最適化して、リアルタイムのデータ取り込み、ベクトル検索、必要に応じて微調整をサポートします。
-
セキュリティ – 暗号化、ロールベースのアクセスコントロール (RBAC)、最小特権のアクセスモデルをデプロイします。Amazon Q Business を使用してデータアクセスを制御し、生成 AI ソリューションがユーザーがアクセスを許可されているデータのみを取得するようにすることができます。
-
オペレーション – データオブザーバビリティのプラクティスを確立します。データの系統、出所、品質メトリクスを追跡して、スケーリング前のギャップを特定します。
レベル 4: スケーリング
スケール段階では、自動化、標準化、企業全体の導入に重点が移ります。組織は、再利用可能なデータパイプラインを確立し、スケーラブルなガバナンスフレームワークを実装し、データのアクセシビリティ、セキュリティ、コンプライアンスをサポートする堅牢なポリシーを適用します。このフェーズでは、 データ製品を民主化します。これにより、組織全体のチームは、一貫性、品質、制御を維持しながら、新しい生成 AI ソリューションをシームレスに開発してデプロイできます。
この段階では、導入の柱の調整基準を次に示します。
-
ビジネス – 生成 AI プロジェクトを長期的なビジネス目標に合わせます。収益の増加、コスト削減、顧客満足度に焦点を当てます。
-
人材 – 企業全体の AI リテラシープログラムを開発し、AI Centers of Excellence (CoEs。
-
ガバナンス – 部門間で AI ガバナンスポリシーを標準化し、AI の意思決定の一貫性を促進します。
-
プラットフォーム – フェデレーティッドデータアクセスと処理にクラウドネイティブソリューションを使用するスケーラブルな AI データプラットフォームに投資します。
-
セキュリティ – 自動コンプライアンスモニタリング、堅牢なデータ損失防止 (DLP)、継続的な脅威評価を実装します。
-
オペレーション – AI オブザーバビリティフレームワークを確立します。フィードバックループ、異常検出、モデルパフォーマンス分析を大規模に統合します。