Harvest と Grafana を使用した ONTAP ファイルシステムの FSx のモニタリング - FSx for ONTAP

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Harvest と Grafana を使用した ONTAP ファイルシステムの FSx のモニタリング

NetApp Harvest は、ONTAP システムからパフォーマンスとキャパシティのメトリクスを収集するためのオープンソースツールであり、FSx for ONTAP と互換性があります。オープンソースのモニタリングソリューションには、Grafana で Harvest を使用できます。

Harvest と Grafana の開始方法

次のセクションでは、FSx for ONTAP ファイルシステムのパフォーマンスとストレージ容量の使用率を測定するために Harvest と Grafana をセットアップおよび設定する方法について説明します。

Harvest と Grafana を使用して Amazon FSx for NetApp ONTAP ファイルシステムをモニタリングできます。NetApp Harvest は、FSx for ONTAP ファイルシステムからパフォーマンス、容量、ハードウェアメトリクスを収集して ONTAP データセンターをモニタリングします。Grafana は、収集された Harvest メトリクスを表示できるダッシュボードを提供します。

サポートされている Harvest ダッシュボード

Amazon FSx for NetApp ONTAP は、オンプレミスの NetApp ONTAP が公開するのとは異なるメトリクスのセットを公開します。そのため、現在、fsx での使用がサポートされているのは、 のタグが付いたすぐに使用できる次の Harvest ダッシュボードのみです。これらのダッシュボードの一部のパネルには、サポートされていない情報が表示されない可能性があります。

  • 収集: メタデータ

  • ONTAP: アグリゲート

  • ONTAP: cDOT

  • ONTAP: クラスター

  • ONTAP: コンプライアンス

  • ONTAP: データセンター

  • ONTAP: データ保護

  • ONTAP: LUN

  • ONTAP: ネットワーク

  • ONTAP: ノード

  • ONTAP: Qtree

  • ONTAP: セキュリティ

  • ONTAP: SnapMirror

  • ONTAP: SnapMirror の送信先

  • ONTAP: SnapMirror ソース

  • ONTAP: SVM

  • ONTAP: ボリューム

  • ONTAP: SVM 別のボリューム

  • ONTAP: ボリュームの深堀り

以下の Harvest ダッシュボードは FSx for ONTAP でサポートされていますが、Harvest ではデフォルトで有効になっていません。

  • ONTAP: FlexCache

  • ONTAP: FlexGroup

  • ONTAP: NFS クライアント

  • ONTAP: NFSv4 Storepool Monitors

  • ONTAP: NFS のトラブルシューティング

  • ONTAP: NVMe 名前空間

  • ONTAP: SMB

  • ONTAP: ワークロード

サポートされていない Harvest ダッシュボード

以下の Harvest ダッシュボードは、FSx for ONTAP ではサポートされていません

  • ONTAP: ディスク

  • ONTAP: 外部サービスオペレーション

  • ONTAP: ファイルシステム分析 (FSA)

  • ONTAP: ヘッドルーム

  • ONTAP: ヘルス

  • ONTAP: MAV リクエスト

  • ONTAP: MetroCluster

  • ONTAP: 電力

  • ONTAP: シェルフ

  • ONTAP: S3 オブジェクトストア

CloudFormation テンプレート

スタートするには、Harvest と Grafana を実行する Amazon EC2 インスタンスを自動的に起動する CloudFormation テンプレートをデプロイできます。CloudFormation テンプレートへの入力として、fsxadmin ユーザーと、このデプロイの一部として追加されるファイルシステムの Amazon FSx 管理エンドポイントを指定します。デプロイが完了したら、Grafana ダッシュボードにログインしてファイルシステムをモニタリングできます。

このソリューションは CloudFormation を使用して Harvest と Grafana ソリューションのデプロイを自動化します。テンプレートによって Amazon EC2 Linux インスタンスが作成され、Harvest および Grafana ソフトウェアがインストールされます。このソリューションを使用するには、fsx-ontap-harvest-grafana.template CloudFormation テンプレートをダウンロードします。

注記

このソリューションを実装すると、関連付けられた AWS のサービス料金が発生します。詳細については、それらのサービスの料金詳細ページを参照してください。

Amazon EC2 インスタンスタイプ

テンプレートを設定するときは、Amazon EC2 インスタンスタイプを提供します。NetApp のインスタンスサイズに関するレコメンデーションは、モニタリングするファイルシステムの数と収集するメトリクスの数によって異なります。デフォルト設定では、モニタリングする 10 個ごとファイルシステムにつき次のことを推奨しています。

  • CPU: 2 コア

  • メモリ:1 GB

  • ディスク: 500 MB (主にログファイルで使用されます)

次は設定例および選択する t3 インスタンスタイプを示します。

ファイルシステム CPU ディスク インスタンスタイプ

10 未満

2 コア

500 MB

t3.micro

10~40

4 コア

1000 MB

t3.xlarge

40 以上

8 コア

2000 MB

t3.2xlarge

Amazon EC2 インスタンスタイプの詳細については、「Amazon EC2 ユーザーガイド」の「汎用インスタンス」を参照してください。

インスタンスポートルール

Amazon EC2 インスタンスを設定するときは、Amazon EC2 Harvest および Grafana インスタンスが属するセキュリティグループのインバウンドトラフィック用にポート 3000 と 9090 が開いていることを確認します。起動されたインスタンスは HTTPS 経由でエンドポイントに接続するため、エンドポイントを解決する必要があります。これには、DNS 用のポート 53 TCP/UDP が必要です。さらに、エンドポイントに到達するには、HTTPS とインターネットアクセスにポート 443 TCP が必要です。

デプロイ手順

次の手順では、Harvest / Grafana ソリューションを設定してデプロイします。デプロイには約 5 分かかります。スタートする前に、FSx for ONTAP ファイルシステムを AWS アカウント、および以下に示すテンプレートのパラメータ情報内の Amazon Virtual Private Cloud (Amazon VPC) で実行する必要があります。ファイルシステムの作成の詳細については、「ファイルシステムの作成」を参照してください。

Harvest / Grafana ソリューションスタックを起動するには
  1. fsx-ontap-harvest-grafana.CloudFormation テンプレートをダウンロードします。CloudFormation スタックの作成の詳細については、『AWS CloudFormation ユーザーガイド』「AWS CloudFormation コンソールでのスタックの作成」 を参照してください。

    注記

    デフォルトでは、このテンプレートは米国東部 (バージニア北部) AWS リージョンで起動します。このソリューションは、Amazon FSx が利用可能な AWS リージョン で起動する必要があります。詳細については、「AWS 全般のリファレンス」の「Amazon FSx エンドポイントとクォータ」を参照してください。

  2. [Parameters] (パラメータ) については、テンプレートのパラメータを確認し、ファイルシステムのニーズに合わせて変更します。このソリューションは以下のデフォルト値を使用します。

    パラメータ デフォルト 説明
    InstanceType t3.micro

    Amazon EC2 インスタンスタイプ 以下が t3 インスタンスタイプです。

    • t3.micro

    • t3.small

    • t3.medium

    • t3.large

    • t3.xlarge

    • t3.2xlarge

    このパラメータで許可される Amazon EC2 インスタンスタイプ値の完全なリストについては、「fsx-ontap-harvest-grafana.template」を参照してください。

    KeyPair デフォルト値なし Amazon EC2 インスタンスへのアクセスに使用されるキーペア。
    SecurityGroup デフォルト値なし Harvest / Grafana インスタンスのセキュリティグループ ID。Grafana ダッシュボードへのアクセスに使用するクライアントからポート 53 および 443 に加え、受信ポート 3000 と 9090 が開いていることを確認します。
    サブネットタイプ デフォルト値なし public または private のいずれかのサブネット タイプを指定します。インターネットに接続する必要があるリソースには public サブネットを、インターネットに接続しないリソースにはプライベートサブネットを使用してください。詳細については、「Amazon VPC ユーザーガイド」の「サブネットタイプ」を参照してください。
    サブネット デフォルト値なし Amazon FSx for NetApp ONTAP ファイルシステムの優先サブネットと同じサブネットを指定します。Fsx for ONTAP ファイルシステム詳細ページの [Network & security] (ネットワークとセキュリティ) タブの Amazon FSx コンソールで [Preferred subnet] (優先サブネット) の IDを検索できます。
    LatestLinuxAmiId /aws/service/ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2 特定の AWS リージョン 内の Amazon Linux 2 AMI の最新バージョン。
    FSxEndPoint デフォルト値なし ファイルシステムの管理エンドポイントの IP アドレス。FSx for ONTAP ファイルシステムの詳細ページの [Administration] (管理) タブの Amazon FSx コンソールのファイルシステムで管理エンドポイント [IP address] (IP アドレス) を検索できます。
    SecretName デフォルト値なし AWS Secrets Manager ファイルシステムの fsxadmin ユーザーのパスワードを含むシークレット名。これは、ファイルシステムを作成したときに指定したパスワードです。
  3. [Next] (次へ) を選択します。

  4. [Options] (オプション) には、[Next] (次へ) を選択します。

  5. [Review] (確認) で、設定を確認して確定します。テンプレートが IAM リソースを作成することを確認するチェックボックスを選択する必要があります。

  6. [Create] (作成) を選択してスタックをデプロイします。

CloudFormation コンソールの [Status] (ステータス) 欄でスタックのステータスを表示できます。約 5 分で CREATE_COMPLETE (作成完了) のステータスが表示されます。

Grafana にログインする

デプロイが完了したら、ブラウザを使用して、Amazon EC2 インスタンスの IP およびポート 3000 で Grafana ダッシュボードにログインします。

http://EC2_instance_IP:3000

プロンプトが表示されたら、Grafana デフォルトのユーザー名 (admin) とパスワード (pass) を使用します。ログインしたらすぐにパスワードを変更することをお勧めします。

詳細については、GitHub の「NetApp Harvest」ページを参照してください。

Harvest と Grafana のトラブルシューティング

Harvest と Grafana ダッシュボードで言及されているデータが失われている場合、または FSx for ONTAP で Harvest と Grafana をセットアップできない場合は、次のトピックで使用可能な解決策を確認してください。

SVM とボリュームダッシュボードが空白

CloudFormation スタックが正常にデプロイされ、Grafana に連絡できるが、SVM とボリュームダッシュボードが空白の場合は、次の手順を使用して環境のトラブルシューティングを行います。Harvest と Grafana がデプロイされている Amazon EC2 インスタンスへの SSH アクセスが必要です。

  1. Harvest および Grafana クライアントが実行している Amazon EC2 インスタンスに SSH します。

    [~]$ ssh ec2-user@ec2_ip_address
  2. harvest.yml ファイルを開くには、次のコマンドを使用します。

    • FSx for ONTAP インスタンスのエントリが Cluster-2 として作成されたことを確認します。

    • ユーザー名とパスワードのエントリが fsxadmin 認証情報と一致していることを確認します。

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /home/ec2-user/harvest_install/harvest/harvest.yml
  3. パスワードフィールドが空白の場合は、エディタでファイルを開き、次のように fsxadmin パスワードで更新します。

    [ec2-user@ip-ec2_ip_address ~]$ sudo vi /home/ec2-user/harvest_install/harvest/harvest.yml
  4. fsxadmin ユーザー認証情報が、今後のデプロイのために次の形式で Secrets Manager に格納され、fsxadmin_password がパスワードに置き換えられていることを確認します。

    {"username" : "fsxadmin", "password" : "fsxadmin_password"}

タイムアウト後にロールバックされた CloudFormation スタック

CloudFormation スタックを正常にデプロイできず、エラーが発生してロールバックする場合は、次の手順を使用して問題を解決します。CloudFormation スタックによってデプロイされた EC2 インスタンスへの SSH アクセスが必要です。

  1. CloudFormation スタックを再デプロイし、自動ロールバックが無効になっていることを確認します。

  2. Harvest および Grafana クライアントが実行している Amazon EC2 インスタンスに SSH します。

    [~]$ ssh ec2-user@ec2_ip_address
  3. 次のコマンドを使用して、Docker コンテナが正常に開始されたことを確認します。

    [ec2-user@ip-ec2_ip_address ~]$ sudo docker ps

    レスポンスには、次のように 5 つのコンテナが表示されます。

    CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 6b9b3f2085ef rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Restarting (1) 20 seconds ago harvest_cluster-2 3cf3e3623fde rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Up About a minute harvest_cluster-1 708f3b7ef6f8 grafana/grafana "/run.sh" 8 minutes ago Up 8 minutes 0.0.0.0:3000->3000/tcp harvest_grafana 0febee61cab7 prom/alertmanager "/bin/alertmanager -…" 8 minutes ago Up 8 minutes 0.0.0.0:9093->9093/tcp harvest_prometheus_alertmanager 1706d8cd5a0c prom/prometheus "/bin/prometheus --c…" 8 minutes ago Up 8 minutes 0.0.0.0:9090->9090/tcp harvest_prometheus
  4. Docker コンテナが実行されていない場合は、次のように /var/log/cloud-init-output.log ファイルで障害がないか確認します。

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /var/log/cloud-init-output.log PLAY [Manage Harvest] ********************************************************** TASK [Gathering Facts] ********************************************************* ok: [localhost] TASK [Verify images] *********************************************************** failed: [localhost] (item=prom/prometheus) => {"ansible_loop_var": "item", "changed": false, "item": "prom/prometheus", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} failed: [localhost] (item=prom/alertmanager) => {"ansible_loop_var": "item", "changed": false, "item": "prom/alertmanage r", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))"} failed: [localhost] (item=rahulguptajss/harvest) => {"ansible_loop_var": "item", "changed": false, "item": "rahulguptajs s/harvest", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetEr ror(104, 'Connection reset by peer'))"} failed: [localhost] (item=grafana/grafana) => {"ansible_loop_var": "item", "changed": false, "item": "grafana/grafana", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} PLAY RECAP ********************************************************************* localhost : ok=1 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
  5. 障害が発生した場合は、次のコマンドを実行して Harvest コンテナと Grafana コンテナをデプロイします。

    [ec2-user@ip-ec2_ip_address ~]$ sudo su [ec2-user@ip-ec2_ip_address ~]$ cd /home/ec2-user/harvest_install [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml --tags api
  6. sudo docker ps を実行して Harvest と Grafana URL を接続することで、コンテナが正常に開始されたことを確認します。