

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# HA 페어 간 워크로드 밸런싱
<a name="monitor-workload-balance"></a>

HA(고가용성) 페어가 여러 개 있는 파일 시스템이 있는 경우 각 HA 페어에 처리량과 스토리지가 분산됩니다. FSx for ONTAP는 파일 시스템에 기록될 때 자동으로 파일의 균형을 맞추지만 HA 페어를 추가하면 워크로드 데이터와 I/O가 더 이상 균형을 이루지 않습니다. 또한 드문 경우지만 워크로드 데이터 또는 I/O가 파일 시스템의 기존 HA 페어에서 불균형해질 수 있으며, 이는 워크로드의 전체 성능에 영향을 미칠 수 있습니다. 워크로드가 불균형한 경우 각 파일 시스템의 HA 페어(및 그에 상응하는 파일 서버 및 *집계*, 즉 프라이머리 스토리지 계층을 구성하는 스토리지 풀) 간에 워크로드를 재조정할 수 있습니다.

**Topics**
+ [기본 스토리지 사용률 균형](#primary-storage-balance)
+ [파일 서버 및 디스크 성능 사용률 불균형](#server-disk-imbalance)
+ [CloudWatch 차원을 ONTAP CLI 및 REST API 리소스에 매핑](#map-dimensions-to-resources)
+ [클라이언트 리밸런싱](#rebalancing-clients)
+ [볼륨 재조정](#rebalancing-volumes)

## 기본 스토리지 사용률 균형
<a name="primary-storage-balance"></a>

파일 시스템의 기본 스토리지 용량은 집계라고 하는 스토리지 풀의 각 HA 페어 간에 균등하게 분할됩니다. 각 HA 페어에는 하나의 집계가 있습니다. 기본 스토리지 계층의 평균 사용률을 80% 이하로 유지하는 것이 좋습니다. HA 페어가 여러 개인 파일 시스템의 경우 모든 집계에 대해 평균 사용률을 최대 80%까지 유지하는 것이 좋습니다.

80%의 사용률을 유지하면 새 수신 데이터를 위한 여유 공간이 확보되고 유지 관리 작업에 대한 양호한 오버헤드가 유지되어 집계의 여유 공간을 일시적으로 확보할 수 있습니다.

집계가 불균형한 경우 파일 시스템의 기본 스토리지 용량을 늘리거나(각 집계의 스토리지 용량을 늘리는 것에 상응) 집계 간에 볼륨을 이동할 수 있습니다. 자세한 내용은 [집계 간 볼륨 이동](moving-fg-volumes.md) 단원을 참조하십시오.

## 파일 서버 및 디스크 성능 사용률 불균형
<a name="server-disk-imbalance"></a>

파일 시스템의 총 성능 기능(예: 네트워크 처리량, 파일 서버-디스크 처리량 및 IOPS, 디스크 IOPS)은 파일 시스템의 HA 페어 간에 균등하게 분할됩니다. 모든 성능 제한에 대해 평균 사용률을 지속적으로 50% 미만으로 유지하는 것이 좋습니다(최대 최대 사용률은 80% 미만). 이는 모든 HA 페어에서 파일 시스템의 파일 서버 리소스를 전체적으로 사용하는 것뿐만 아니라 파일당 서버 기준으로도 적용됩니다.

파일 서버 성능 사용률이 불균형하고 워크로드가 불균형한 파일 서버의 사용률이 80%를 초과하는 경우 ONTAP CLI 및 REST API를 사용하여 성능 불균형의 원인을 추가로 진단하고 수정할 수 있습니다. 다음은 가능한 불균형 지표와 추가 진단을 위한 다음 단계 표입니다.


| 파일 시스템의 | 해당되는 조치 | 
| --- | --- | 
| 파일 서버 디스크 처리량 또는 파일 서버 디스크 IOPS 불균형 | HA 페어의 하위 집합(액세스되는 데이터의 양이 너무 많은 볼륨의 하위 집합)에서 I/O 핫스팟이 발생할 수 있으며, 이로 인해 HA 페어의 하위 집합에 대해 병목 현상이 발생하기 때문에 워크로드의 전체 성능이 제한될 수 있습니다. 활용도가 높은 각 파일 서버에 대해 가장 많이 사용되는 볼륨을 확인하여 집계 내에서 활동이 가장 높은 볼륨을 확인합니다. 이 절차에 대한 자세한 정보는 [볼륨 재조정](#rebalancing-volumes) 단원을 참조하세요. | 
| 네트워크 처리량이 불균형하지만 파일 서버 디스크 처리량, 파일 서버 디스크 IOPS 또는 디스크 IOPS가 불균형하지 않음  | 데이터는 HA 페어 간에 균등하게 분산되지만 클라이언트는 그렇지 않습니다. 다른 것보다 네트워크 처리량 사용률이 더 높은 파일 서버의 경우 각 파일 서버의 최상위 클라이언트를 확인한 다음 해당 클라이언트에서 볼륨을 탑재 해제하고 다른 HA 페어에서 다른 엔드포인트를 사용하여 다시 탑재하여 해당 클라이언트의 균형을 조정합니다. 이 절차에 대한 자세한 정보는 [클라이언트 리밸런싱](#rebalancing-clients) 단원을 참조하세요. | 

## CloudWatch 차원을 ONTAP CLI 및 REST API 리소스에 매핑
<a name="map-dimensions-to-resources"></a>

2세대 파일 시스템에는 `FileServer` 또는 `Aggregate` 차원이 있는 Amazon CloudWatch 지표가 있습니다. 불균형 사례를 추가로 진단하려면 이러한 차원 값을 ONTAP CLI 또는 REST API의 특정 파일 서버(또는 *노드*) 및 집계에 매핑해야 합니다.
+ 파일 서버의 경우 각 파일 서버 이름은 ONTAP의 파일 서버(또는 노드) 이름(예: `FsxId01234567890abcdef-01`)에 매핑됩니다. 홀수 번호의 파일 서버는 선호하는 파일 서버(즉, 파일 시스템이 보조 파일 서버로 장애 조치되지 않은 한 트래픽을 서비스함)이고, 짝수 번호의 파일 서버는 보조 파일 서버(즉, 파트너를 사용할 수 없는 경우에만 트래픽을 서비스함)입니다. 따라서 보조 파일 서버는 일반적으로 선호하는 파일 서버보다 사용률이 낮습니다.
+ 집계의 경우 각 집계 이름은 ONTAP의 집계에 매핑됩니다(예: `aggr1`). 모든 HA 페어에는 하나의 집계가 있는데, 즉, 집계 `aggr1`는 HA 페어의 파일 서버 `FsxId01234567890abcdef-01`(활성 파일 서버)와 `FsxId01234567890abcdef-02`(보조 파일 서버)가 공유하고, 집계 `aggr2`는 파일 서버 `FsxId01234567890abcdef-03`와 `FsxId01234567890abcdef-04`가 공유하는 식입니다.

ONTAP CLI를 사용하여 모든 집계와 파일 서버 간의 매핑을 볼 수 있습니다.

1.  파일 시스템의 NetApp ONTAP CLI에 SSH를 설정하려면 *Amazon FSx for NetApp ONTAP 사용 설명서*의 [NetApp ONTAP CLI 사용](managing-resources-ontap-apps.md#netapp-ontap-cli) 섹션에 설명된 단계를 따릅니다.

   ```
   ssh fsxadmin@{{file-system-management-endpoint-ip-address}}
   ```

1. [스토리지 집계 표시](https://docs.netapp.com/us-en/ontap-cli-9131/storage-aggregate-show.html) 명령을 사용하여 `-fields node` 파라미터를 지정합니다.

   ```
   ::> storage aggregate show -fields node
   aggregate                       node                      
   ------------------------------- ------------------------- 
   aggr1                           FsxId01234567890abcdef-01
   aggr2                           FsxId01234567890abcdef-03
   aggr3                           FsxId01234567890abcdef-05 
   aggr4                           FsxId01234567890abcdef-07
   aggr5                           FsxId01234567890abcdef-09
   aggr6                           FsxId01234567890abcdef-11 
   6 entries were displayed.
   ```

## 클라이언트 리밸런싱
<a name="rebalancing-clients"></a>

HA 페어를 추가한 후 또는 파일 서버 간에 I/O 불균형이 발생하는 경우(특히 네트워크 처리량 사용률에 따라) 클라이언트를 재조정할 수 있습니다. HA 페어를 추가한 후 클라이언트의 리밸런싱을 수행하는 경우 [클라이언트 재탑재](#remounting-clients)로 건너뛸 수 있습니다. 그렇지 않으면 먼저 이동하려는 트래픽이 많은 클라이언트를 식별하여 워크로드 I/O의 균형을 재조정해야 합니다.

파일 서버(특히 네트워크 처리량 사용률) 간에 I/O 불균형이 발생하는 경우 I/O 클라이언트가 높을 수 있습니다. 트래픽이 많은 클라이언트를 식별하려면 ONTAP CLI를 사용합니다.

**트래픽이 많은 클라이언트 식별**

1. 파일 시스템의 NetApp ONTAP CLI에 SSH를 설정하려면 *Amazon FSx for NetApp ONTAP 사용 설명서*의 [NetApp ONTAP CLI 사용](managing-resources-ontap-apps.md#netapp-ontap-cli) 섹션에 설명된 단계를 따릅니다.

   ```
   ssh fsxadmin@{{file-system-management-endpoint-ip-address}}
   ```

1. 트래픽이 가장 높은 클라이언트를 보려면 [통계 상위 클라이언트 show](https://docs.netapp.com/us-en/ontap-cli-9131/statistics-top-client-show.html) ONTAP CLI 명령을 사용합니다. 선택적으로 `-node` 파라미터를 지정하여 특정 파일 서버의 최상위 클라이언트만 볼 수 있습니다. 특정 파일 서버의 불균형을 진단하는 경우 `-node` 파라미터를 사용하고 `node_name`를 파일 서버의 이름으로 바꿉니다(예: `FsxId01234567890abcdef-01`).

   선택적으로 `-interval` 파라미터를 추가하여 각 보고서가 출력되기 전에 측정할 간격(초)을 제공할 수 있습니다. 간격을 늘리면(예: 최대 300초) 각 볼륨으로 구동되는 트래픽 양에 대한 장기 샘플이 제공됩니다. 기본값은 `5`(초)입니다.

   ```
   ::> statistics top client show -node {{FsxId01234567890abcdef-01}} [-interval [5,300]]
   ```

   출력에서 최상위 클라이언트는 IP 주소 및 포트별로 표시됩니다.

   ```
                                                          *Total     Total
               Client   Vserver          Node                Ops     (Bps)
   ------------------ --------- ------------------------- ------ ---------
    172.17.236.53:938 svm01     FsxId01234567890abcdef-01   2143 140443648
   172.17.236.160:898 svm02     FsxId01234567890abcdef-01    812  53215232
   ```<a name="remounting-clients"></a>

**클라이언트 재탑재**
+ 클라이언트를 다른 HA 페어로 리밸런싱할 수 있습니다. 이렇게 하려면 클라이언트에서 볼륨을 탑재재 해제하고 SVM의 NFS/SMB 엔드포인트의 DNS 이름을 사용하여 다시 탑재재합니다. 그러면 무작위 HA 페어에 해당하는 무작위 엔드포인트가 반환됩니다.

  DNS 이름을 재사용하는 것이 좋지만 지정된 클라이언트 탑재재에 대해 명시적으로 HA 페어를 선택할 수 있는 옵션이 있습니다. 클라이언트를 다른 엔드포인트에 탑재하고 있는지 확인하기 위해 트래픽이 많은 파일 서버에 해당하는 것과 다른 엔드포인트 IP 주소를 대신 지정할 수 있습니다. 다음 명령을 실행하면 됩니다.

  ```
  ::> network interface show -vserver {{svm_name}} -lif nfs_smb_management* -fields address,curr-node
  vserver   lif                  address      curr-node                 
  --------- -------------------- ------------ ------------------------- 
  svm01 nfs_smb_management_1 172.31.15.89 FsxId01234567890abcdef-01 
  svm01 nfs_smb_management_3 172.31.8.112 FsxId01234567890abcdef-03 
  2 entries were displayed.
  ```

  `statistics top client show` 명령의 예제 출력에 따르면 클라이언트 `172.17.236.53`는 `FsxId01234567890abcdef-01`로 높은 트래픽을 유도하고 있습니다. `network interface show` 명령의 출력은 이 주소 `172.31.15.89`임을 나타냅니다. 다른 엔드포인트에 탑재하려면 다른 주소를 선택합니다(이 예제에서는 `FsxId01234567890abcdef-03`에 해당하는 유일한 다른 주소는 `172.31.8.112`입니다).

## 볼륨 재조정
<a name="rebalancing-volumes"></a>

볼륨 또는 집계에 I/O 불균형이 발생하는 경우 볼륨을 재조정하여 볼륨 전체에 I/O 트래픽을 재분배할 수 있습니다.

**참고**  
집계에 스토리지 사용률 불균형이 발생하는 경우 높은 사용률이 I/O 불균형과 결합되지 않는 한 일반적으로 성능에 영향을 주지 않습니다. 스토리지 사용률의 균형을 맞추기 위해 집계 간에 볼륨을 이동할 수 있지만 성능에 영향을 미치는 경우에만 볼륨을 이동하는 것이 좋습니다. 이동 볼륨은 이동을 고려 중인 각 볼륨에 I/O를 구동하지 않으면 성능에 부정적인 영향을 미칠 수 있습니다.

1. 파일 시스템의 NetApp ONTAP CLI에 SSH를 설정하려면 *Amazon FSx for NetApp ONTAP 사용 설명서*의 [NetApp ONTAP CLI 사용](managing-resources-ontap-apps.md#netapp-ontap-cli) 섹션에 설명된 단계를 따릅니다.

   ```
   ssh fsxadmin@{{file-system-management-endpoint-ip-address}}
   ```

1. [통계 볼륨 show](https://docs.netapp.com/us-en/ontap-cli-9131/statistics-volume-show.html) ONTAP CLI 명령을 사용하여 다음과 같은 변경 사항과 함께 지정된 집계의 최고 트래픽 볼륨을 확인합니다.
   + {{aggregate\_name}}을 aggregate의 이름으로 바꿉니다(예: `aggr1`).
   + 선택적으로 `-interval` 파라미터를 추가하여 각 보고서가 출력되기 전에 측정할 간격(초)을 제공할 수 있습니다. 간격을 늘리면(예: 최대 300초) 각 볼륨으로 구동되는 트래픽 양에 대한 장기 샘플이 제공됩니다. 기본값은 `5`(초)입니다.

   ```
   ::> statistics volume show -aggregate {{aggregate_name}} -sort-key total_ops [-interval [5,300]]
   ```

   선택한 간격에 따라 데이터를 표시하는 데 최대 5분이 걸릴 수 있습니다. 명령은 각 집계로 구동되는 트래픽 양과 함께 집계의 모든 볼륨을 표시합니다.

   ```
                                *Total Read Write Other      Read Write Latency 
       Volume Vserver Aggregate    Ops  Ops   Ops   Ops     (Bps) (Bps)    (us) 
   ---------- ------- --------- ------ ---- ----- ----- --------- ----- ------- 
   vol1__0007    svm1     aggr1   4078 4078     0     0 267255808     0    1092 
   vol1__0005    svm1     aggr1   4078 4078     0     0 267255808     0    1086 
   vol1__0003    svm1     aggr1   4077 4077     0     0 267223040     0    1086 
   vol1__0001    svm1     aggr1   4077 4077     0     0 267239424     0    1087 
   vol1__0008    svm1     aggr2   2314 2314     0     0 151650304     0    1112 
   vol1__0006    svm1     aggr2   2144 2144     0     0 140509184     0    1104 
   vol1__0002    svm1     aggr2   2183 2183     0     0 143065088     0    1106 
   vol1__0004    svm1     aggr2   2183 2183     0     0 143065088     0    1103
   ```

   볼륨 통계는 구성 요소별로 표시됩니다(예: `vol1__0015`는 FlexGroup `vol1`의 15번째 구성 요소). 예시 출력에서 `aggr1`의 구성 요소가 `aggr2`의 구성 요소보다 활용도가 높다는 것을 알 수 있습니다. 집계 간 트래픽의 균형을 맞추기 위해 트래픽이 더 균등하게 분산되도록 구성 볼륨을 집계 간에 이동할 수 있습니다.

1. 새 HA 페어를 추가한 경우 기존 볼륨을 새 집계로 이동해야 합니다. 자세한 내용은 [집계 간 볼륨 이동](moving-fg-volumes.md) 단원을 참조하십시오.