FSx for Windows File Server のデータシャーディングを理解する - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

FSx for Windows File Server のデータシャーディングを理解する

概要:

FSx for Windows File Server のパフォーマンスは設定によって異なります。主にストレージタイプ、ストレージキャパシティ、およびスループット設定に基づいています。選択したスループットキャパシティによって、ネットワーク I/O 制限、CPU とメモリ、ファイルサーバーによって課されるディスク I/O 制限など、ファイルサーバーで使用できるパフォーマンスリソースが決まります。選択したストレージキャパシティとストレージタイプによって、ストレージボリュームで使用できるパフォーマンスリソース、つまりストレージディスクによって課されるディスク I/O 制限が決まります。パフォーマンスに加えて、設定の選択もコストに影響します。FSx for Windows File Server の料金は、主にストレージキャパシティとストレージタイプ、スループットキャパシティ、バックアップ、および転送されたデータによって異なります。

ファイルストレージとパフォーマンスの要件が比較的大きい場合は、データシャーディングのメリットを受けることができます。データシャーディングには、より小さなデータセット (シャード) にファイルデータを分割し、それらを異なるファイルシステム間に保存することが含まれています。複数のインスタンスからデータにアクセスするアプリケーションは、これらのシャードに対して並行して読み取りと書き込みを行うことで、高いレベルのパフォーマンスを設定できます。同時に、共通の名前空間下で統一されたビューをアプリケーションに表示することもできます。また、大きいファイルデータセット (最大数百ペタバイト) に対して各ファイルシステムがサポートするサイズ (64 TB) を超えるファイルのデータストレージをスケーリングする際にも役立ちます。

コストへの影響

大規模なデータセットの場合、通常、同じレベルのパフォーマンスを実現するために、1 つの大きな SSD 共有ではなく、複数の小さな FSx for Windows File Server ファイルシステムをデプロイする方が効果的です。FSx for Windows File Server HDD ストレージタイプと SSD ストレージタイプを組み合わせて使用すると、コストをさらに削減でき、ワークロードを基盤となる最適なディスクサブシステムに適合させることができます。次の表では、単一の 17 TB ファイルシステムの違いを確認し、同じキャパシティに追加する複数の小さなファイルシステムと比較することができます。

複数のワークロードを持つ大規模な SSD ファイルシステム

[Server name] (サーバー名) Cost 設定 リージョン
Amazon FSx for Windows File Server 5,716 USD

17 TB SSD

30% 重複排除

256 Mbps

17 TB バックアップ

米国東部 (バージニア北部)

DFSN を使用したパーティション化されたワークロード

[Server name] (サーバー名) Cost 設定 リージョン 共有
Amazon FSx for Windows File Server 1,024 USD

2 TB SSD

20% 重複排除

128 Mbps

2 TB バックアップ

マルチ AZ

米国東部 (バージニア北部) 共有 1
Amazon FSx for Windows File Server 2,132 USD

5 TB SSD

30% 重複排除

256 Mbps

5 TB バックアップ

マルチ AZ

米国東部 (バージニア北部) 共有 2
Amazon FSx for Windows File Server 1,036 USD

10 TB HDD

40% 重複排除

128 Mbps

10 TB バックアップ

マルチ AZ

米国東部 (バージニア北部) 共有 3
DFSN Windows EC2 インスタンス 27 USD

t3a.medium

2 vCPU

4 GiB メモリ

米国東部 (バージニア北部) DFSN インスタンス

大規模な SSD ファイルシステムの年間コストは 68,592 USD です。パーティション化されたワークロードの年間コストは 50,640 USD です。この例では、ワークロードを適切なバックエンドストレージに適合させながら、26% の削減を実現できます。料金見積もりの詳細については、AWS 料金見積りツール の見積もりを参照してください。

コスト最適化の推奨事項

データ重複排除ソリューションをデプロイするには、データのタイプ、I/O サイズ、I/O アクセスパターンに基づいて Microsoft DFS 名前空間を設定する必要があります。各名前空間は、最大 50,000 のファイル共有と、全体で数百ペタバイトのストレージキャパシティをサポートします。

使用する予定のすべてのファイルシステムに I/O を均等に分散するシャーディング方式を選択すると、最も効率的に機能します。ワークロードのモニタリングは、追加の最適化やコスト削減に役立ちます。Amazon FSx ファイルシステムのパフォーマンス情報の測定にヘルプが必要な場合は、FSx for Windows File Server ドキュメントの「FSx for Windows File Server performance」を参照してください。

シャーディング戦略を選択したら、DFS 名前空間を使用して共有に簡単にアクセスできるようにファイルシステムをグループ化できます。これにより、ユーザーは、実際には専用のユースケースを使用してさまざまなファイルシステムにアクセスしているときも、1 つの同種ファイルシステムを見ることになります。エンドユーザーが共有がどのようなワークロード向けに設計されているかを簡単に解読できるように、適切な命名規則で共有を作成することが重要です。また、エンドユーザーが誤って間違ったファイルシステムにファイルを配置しないように、本番用共有と非本番用共有にラベルを付けることも重要です。

次の図は、単一の DFS 名前空間を複数の Amazon FSx ファイルシステムのアクセスポイントとして使用する方法を示しています。

DFN 名前空間アクセスポイント

以下に留意してください。

  • 既存の FSx for Windows File Server 共有を DFS ツリーに追加できます。

  • Amazon FSx を DFS 共有パスのルートに追加することはできません。サブフォルダは 1 つだけです。

  • DFS 名前空間設定を提供するには、EC2 インスタンスをデプロイする必要があります。

DFS-N 設定の詳細については、Microsoft ドキュメントの「DFS Namespaces overview」を参照してください。DFS 名前空間の使用の詳細については、YouTube の動画「Using DFS Namespaces with Amazon FSx for Windows File Server」を参照してください。

その他のリソース