トラブルシューティング: File Gateway の問題 - AWS Storage Gateway

新規のお客様への Amazon FSx File Gateway の提供は終了しました。FSx File Gateway の既存のお客様は、通常どおりサービスを引き続き使用できます。FSx File Gateway に似た機能については、このブログ記事を参照してください。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トラブルシューティング: File Gateway の問題

Amazon CloudWatch ロググループにログエントリを書き込むように File Gateway を設定できます。その場合、ゲートウェイのヘルスステータスと、ゲートウェイで発生したエラーに関する通知を受け取ります。CloudWatch Logs で、これらのエラーおよびヘルス通知に関する情報を参照できます。

以下のセクションでは、各エラーとヘルス通知の原因、およびその問題の修正方法を理解するのに役立つ情報が見つかります。

エラー: FileMissing

FileMissing エラーはObjectMissingエラーに似ており、解決するステップは同じです。指定されたファイルゲートウェイ以外のライターが Amazon FSx から指定されたファイルを削除すると、FileMissingエラーが発生することがあります。オブジェクトの Amazon FSx へのそれ以降のアップロードまたは Amazon FSx からの取り出しは失敗します。

FileMissing エラーを解決するには
  1. ファイルの最新のコピーを SMB クライアントのローカルファイルシステムに保存します (このファイルのコピーはステップ 3 で必要)。

  2. SMB クライアントを使用して、ファイルゲートウェイからファイルを削除します。

  3. SMB クライアントを使用して、ステップ 1 Amazon FSx で保存したファイルの最新バージョンをコピーします。これを行うには、ファイルゲートウェイを使用します。

エラー: FsxFileSystemAuthenticationFailure

ファイルシステムのアタッチ中に提供された認証情報の有効期限が切れているか、その権限が取り消されると、FsxFileSystemAuthenticationFailureエラーが発生することがあります。

FsxFileSystemAuthenticationFailure エラーを解決するには
  1. Amazon FSx ファイルシステムのアタッチ時に提供された認証情報がまだ有効であることを確認します。

  2. 「Amazon FSx for Windows File Server ファイルシステムのアタッチ」で説明されているように、ユーザーにすべての必要なアクセス許可があることを確認します。

エラー: FsxFileSystemConnectionFailure

Amazon FSx サーバーがゲートウェイマシンからアクセスできない場合、FsxFileSystemConnectionFailureエラーが発生することがあります。

FsxFileSystemConnectionFailure エラーを解決するには
  1. すべてのファイアウォールと VPC ルールで、ゲートウェイマシンと Amazon FSx サーバー間の接続が許可されていることを確認します。

  2. Amazon FSx サーバーが実行されていることを確認します。

エラー: FsxFileSystemFull

Amazon FSx ファイルシステムに十分な空きディスク容量がない場合、FsxFileSystemFullエラーが発生することがあります。

FsxFileSystemFull エラーを解決するには
  • Amazon FSx ファイルシステムのストレージ容量を増やします。

エラー: GatewayClockOutOfSync

ゲートウェイがローカルシステム時刻と AWS Storage Gatewayサーバーによって報告された時刻の差を 5 分以上検出すると、GatewayClockOutOfSyncエラーが発生することがあります。クロック同期の問題は、ゲートウェイと 間の接続に悪影響を及ぼす可能性があります AWS。ゲートウェイクロックが同期していない場合、NFS および SMB 接続で I/O エラーが発生し、SMB ユーザーに認証エラーが発生する可能性があります。

GatewayClockOutOfSync エラーを解決するには

エラー: InvalidFileState

指定されたゲートウェイ以外のライターが、指定されたファイル共有内の指定されたファイルを変更すると、InvalidFileStateエラーが発生することがあります。その結果、ゲートウェイ上のファイルの状態が Amazon FSx の状態と一致しません。Amazon FSx からのファイルのアップロードまたは取得は失敗する可能性があります。

InvalidFileState エラーを解決するには
  1. ファイルの最新のコピーを SMB クライアントのローカルファイルシステムに保存します (ステップ 4 でコピーするにはこのファイルが必要です)。Amazon FSx のファイルのバージョンが最新の場合は、そのバージョンをダウンロードします。これを行うには、任意の SMB クライアントを使用して Amazon FSx 共有に直接アクセスします。

  2. Amazon FSx でファイルを直接削除します。

  3. SMB クライアントを使用してゲートウェイからファイルを削除します。

  4. SMB クライアントを使用して、ステップ 1 で保存したファイルの最新バージョンをファイルゲートウェイ経由で Amazon FSx にコピーします。

エラー: ObjectMissing

指定されたファイルゲートウェイ以外のライターが Amazon FSx から指定されたファイルを削除すると、ObjectMissingエラーが発生することがあります。オブジェクトの Amazon FSx へのそれ以降のアップロードまたは Amazon FSx からの取り出しは失敗します。

ObjectMissing エラーを解決するには
  1. ファイルの最新のコピーを SMB クライアントのローカルファイルシステムに保存します (このファイルのコピーはステップ 3 で必要)。

  2. SMB クライアントを使用してファイルゲートウェイからファイルを削除します。

  3. SMB クライアントを使用して、ステップ 1 Amazon FSx で保存したファイルの最新バージョンをコピーします。これを行うには、ファイルゲートウェイを使用します。

エラー: DroppedNotifications

ゲートウェイのルートディスクの空きストレージ容量が 1 GB 未満の場合、または 1 分以内に 100 を超えるヘルス通知が生成された場合、他の予想されるタイプの CloudWatch ログエントリの代わりにDroppedNotificationsエラーが表示されることがあります。このような状況では、ゲートウェイは予防策として詳細な CloudWatch ログ通知の生成を停止します。

DroppedNotifications エラーを解決するには

  1. Storage Gateway コンソールのゲートウェイのモニタリングタブのRoot Disk Usageメトリクスをチェックして、使用可能なルートディスク容量が少ないかどうかを確認します。

  2. 使用可能な容量が 1 GB 未満の場合は、ゲートウェイのルートストレージディスクのサイズを増やします。手順については、仮想マシンハイパーバイザーのドキュメントを参照してください。

    Amazon EC2 ゲートウェイのルートディスクサイズを増やすには、「Amazon Elastic Compute Cloud ユーザーガイド」の「EBS ボリュームの変更をリクエストする」を参照してください。

    注記

    AWS Storage Gateway ハードウェアアプライアンスのルートディスクサイズを増やすことはできません。

  3. ゲートウェイを再起動します。

通知: HardReboot

ゲートウェイ VM が予期せず再起動された場合、HardReboot 通知が表示されることがあります。このような再起動の原因としては、電源の喪失、ハードウェア障害、またはその他のイベントが考えられます。VMware ゲートウェイの場合、vSphere High Availability Application Monitoring によってリセットされると、このイベントが発生する可能性があります。

ゲートウェイがこのような環境で実行されている場合は、HealthCheckFailure 通知の有無を確認し、VM の VMware イベントログを調べます。

通知: Reboot

ゲートウェイ VM の再起動時に、再起動通知が表示される場合があります。VM ハイパーバイザーの管理コンソールまたは Storage Gateway コンソールを使用して、ゲートウェイ VM を再起動できます。また、ゲートウェイのメンテナンスサイクル中にゲートウェイソフトウェアを使用して再起動することもできます。

再起動の時刻がゲートウェイで設定されたメンテナンス開始時刻から 10 分以内である場合、この再起動の発生はおそらく正常であり、問題の兆候ではありません。メンテナンス期間外に著しく再起動が発生した場合は、ゲートウェイを手動で再起動したかどうかを確認します。

トラブルシューティング: Active Directory ドメインの問題

FSx File Gateway は、Active Directory ドメインの問題に関する特定のログメッセージを生成しません。ゲートウェイを Active Directory ドメインに接続できない場合は、次の操作を行います。

  • ゲートウェイが読み取り専用ドメインコントローラー (RODC) を使用してドメインに参加していないことを確認します。

  • ゲートウェイが正しい DNS サーバーを使用するように設定されていることを確認します。

    例えば、Amazon EC2 ゲートウェイインスタンスを AWSマネージド Active Directory に参加させる場合は、EC2 VPC の DHCP オプションセットが AWSマネージド Active Directory DNS サーバーを指定していることを確認します。

    VPC DHCP オプションセットを使用して設定する DNS サーバーは、VPC 内のすべての EC2 インスタンスに提供されます。個々のゲートウェイに DNS サーバーを指定する場合は、そのゲートウェイの EC2 ローカルコンソールを使用して指定できます。

    オンプレミスゲートウェイの場合は、VM ローカルコンソールを使用して DNS サーバーを指定します。

  • ゲートウェイのローカルコンソールのコマンドプロンプトから次のコマンドを実行して、ゲートウェイのネットワーク接続を確認します。強調表示された変数を、デプロイの実際のドメイン名と IP アドレスに置き換えます。

    dig -d ExampleDomainName ncport -d ExampleDomainControllerIPAddress -p 445 ncport -d ExampleDomainControllerIPAddress -p 389
  • Active Directory サービスアカウントに、必要なアクセス許可があることを確認します。詳細については、Active Directory サービスアカウントのアクセス許可要件」を参照してください。

  • ゲートウェイが正しい組織単位 (OU) に参加していることを確認します。

    ドメインに参加すると、ゲートウェイのゲートウェイ ID をアカウント名 (SGW-1234ADE など) として使用して、デフォルトのコンピュータコンテナ (OU ではない) に Active Directory コンピュータアカウントが作成されます。このアカウントの名前をカスタマイズすることはできません。

    Active Directory 環境に新しいコンピュータオブジェクト用に指定された OU がある場合は、ドメインに参加するときにその OU を指定する必要があります。

    指定された OU に参加しようとしたときにアクセス拒否エラーが発生した場合は、Active Directory ドメイン管理者に確認してください。管理者は、ドメインに参加する前にゲートウェイのコンピュータアカウントを事前ステージングする必要がある場合があります。詳細については、Storage Gateway ファイルゲートウェイを Microsoft Active Directory 認証用のドメインに結合する際の問題をトラブルシューティングするにはどうすればよいですか?」を参照してください。

  • ゲートウェイのローカルコンソールのコマンドプロンプトから次のコマンドを実行して、ゲートウェイのホスト名が DNS で解決可能であることを確認します。強調表示された変数をゲートウェイの実際のホスト名に置き換えます。

    dig -d ExampleHostName -r A

    ゲートウェイにカスタムホスト名を設定した場合は、IP アドレスを指す DNS A レコードを手動で追加する必要があります。

  • ゲートウェイとドメインコントローラー間のネットワークレイテンシーが合理的に低いことを確認します。ゲートウェイが 20 秒以内にドメインコントローラーからレスポンスを受信しない場合、ドメインに参加するクエリがタイムアウトすることがあります。

    JoinDomain CLI コマンドを使用してゲートウェイをドメインに結合する場合は、 --timeout-in-secondsフラグを追加してタイムアウトを最大 3,600 秒に増やすことができます。

  • ゲートウェイをドメインに結合するために使用する Active Directory ユーザーが、そのために必要な権限を持っていることを確認します。

トラブルシューティング: CloudWatch メトリクスの使用

Storage Gateway で Amazon CloudWatch メトリクスを使用して問題に対処するアクションについては、次の情報を参照してください。

ディレクトリの閲覧時にゲートウェイの反応が遅い

ls コマンドの実行時またはディレクトリの参照時にファイルゲートウェイの反応が遅い場合は、 IndexFetchおよび IndexEviction CloudWatch メトリクスを確認します。

  • ls コマンドの実行時またはディレクトリの参照時にIndexFetchメトリクスが 0 より大きい場合、ファイルゲートウェイは影響を受けるディレクトリの内容に関する情報なしで起動し、FSx for Windows File Server にアクセスする必要がありました。今後そのディレクトリの内容をリストする作業の速度は上がるはずです。

  • IndexEviction メトリクスが 0 より大きい場合、その時点でファイルゲートウェイがキャッシュで管理できる制限に達したことを意味します。この場合、ファイルゲートウェイは、最近アクセスされたディレクトリから一部のストレージ領域を解放して、新しいディレクトリを一覧表示する必要があります。この問題が頻繁に発生し、パフォーマンスへの影響がある場合は、 にお問い合わせください サポート。

    関連する Amazon FSx ファイルシステム サポート の内容と、ユースケースに基づいてパフォーマンスを向上させるための推奨事項について説明します。

ゲートウェイが応答しない

ファイルゲートウェイが応答しない場合は、次の操作を行います。

  • 最近再起動またはソフトウェアの更新を行った場合は、IOWaitPercent メトリクスを確認します。このメトリクスは、未処理のディスク I/O リクエストがある場合に、CPU がアイドル状態の時間の割合を示します。場合によっては、この値が高く (10 以上)、サーバーの再起動または更新後に増えていることがあります。このような場合、インデックスキャッシュを RAM に再構築する際に、File Gateway がスロールートディスクによってボトルネックになる可能性があります。より高速な物理ディスクをルートディスクに使用することにより、この問題に対処できます。

  • MemUsedBytes メトリクスが MemTotalBytesメトリクスと同じかほぼ同じ場合、ファイルゲートウェイで使用可能な RAM が不足しています。ファイルゲートウェイに必要な最小限の RAM があることを確認してください。すでにある場合は、ワークロードとユースケースに基づいて File Gateway に RAM を追加することを検討してください。

    ファイル共有が SMB の場合は、ファイル共有に接続されている SMB クライアントの数が原因である可能性もあります。任意の時点で接続しているクライアントの数を確認するには、SMBV(1/2/3)Sessions メトリクスをチェックします。接続されているクライアントが多数ある場合は、ファイルゲートウェイに RAM を追加する必要がある場合があります。

Amazon FSx ファイルシステムにファイルが表示されない

ゲートウェイ上のファイルが Amazon FSx ファイルシステムに反映されていない場合は、 FilesFailingUploadメトリクスを確認してください。メトリクスが一部のファイルのアップロードに失敗したことを報告している場合は、ヘルス通知を確認します。ファイルのアップロードに失敗すると、ゲートウェイは問題の詳細を含むヘルス通知を生成します。

Amazon FSx ファイルシステムに古いスナップショットが表示されない

最上位フォルダの名前変更やアクセス許可の変更など、FSx File Gateway での一部のファイルオペレーションでは、複数のファイルオペレーションが発生し、FSx for Windows File Server ファイルシステムに高い I/O 負荷が発生する可能性があります。ファイルシステムにワークロードに十分なパフォーマンスリソースがない場合、ファイルシステムはシャドウコピーの保持履歴よりも継続的な I/O の可用性を優先するため、シャドウコピーを削除する可能性があります。

Amazon FSx コンソールで、モニタリングとパフォーマンスのページをチェックして、ファイルシステムがプロビジョニング不足かどうかを確認します。その場合は、SSD ストレージに切り替えたり、スループットキャパシティを増やしたり、SSD IOPS を増やしてワークロードを処理したりできます。

ゲートウェイから Amazon FSx へのデータ転送が遅い

ファイルゲートウェイから Amazon FSx for Windows File Server へのデータ転送が遅い場合は、次の操作を行います。

  • CachePercentDirty メトリクスが 80 以上の場合、ファイルゲートウェイは Amazon FSx for Windows File Server にデータをアップロードできるよりも速くデータをディスクに書き込んでいます。ファイルゲートウェイからのアップロードの帯域幅を増やすか、1 つ以上のキャッシュディスクを追加するか、クライアントの書き込みを遅くするか、関連する Amazon FSx for Windows File Server のスループットキャパシティを増やすことを検討してください。

  • CachePercentDirty メトリクスが低い場合は、IoWaitPercent メトリクスを確認します。IoWaitPercent が 10 より大きい場合、ローカルキャッシュディスクの速度によってファイルゲートウェイがボトルネックになる可能性があります。キャッシュには、ローカルソリッドステートドライブ (SSD) ディスク (できれば NVM Express (NVMe)) をお勧めします。このようなディスクが使用できない場合は、パフォーマンスを向上させるために、別々の物理ディスクから複数のキャッシュディスクを使用してみてください。

ゲートウェイへの書き込み時にゲートウェイのバックアップジョブが失敗する、またはエラーが発生する

File Gateway バックアップジョブが失敗した場合、または File Gateway への書き込み時にエラーが発生した場合は、次の操作を行います。

  • CachePercentDirty メトリクスが 90% 以上の場合、キャッシュディスクに十分な空き容量がないため、ファイルゲートウェイはディスクへの新しい書き込みを受け入れることができません。ファイルゲートウェイが FSx for Windows File Server にアップロードされている速度を確認するには、 CloudBytesUploadedメトリクスを表示します。そのメトリクスを、クライアントがファイルゲートウェイにファイルを書き込む速度を示す WriteBytesメトリクスと比較します。SMB クライアントが FSx for Windows File Server にアップロードできるよりも速くファイルゲートウェイに書き込んでいる場合は、少なくともバックアップジョブのサイズをカバーするキャッシュディスクを追加します。または、アップロード帯域幅を増やします。

  • バックアップジョブなどの大きなファイルコピーが失敗してもCachePercentDirtyメトリクスが 80% 未満の場合、ファイルゲートウェイがクライアント側のセッションタイムアウトにヒットしている可能性があります。SMB の場合は、PowerShell コマンド Set-SmbClientConfiguration -SessionTimeout 300 を使用してこのタイムアウトを増やすことができます。このコマンドを実行すると、タイムアウトが 300 秒に設定されます。