

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 對檔案系統掛載問題進行故障診斷
<a name="mount-troubleshooting"></a>

檔案系統掛載命令失敗時，有許多潛在原因，如下列主題所述。

## 檔案系統掛載會立即失敗
<a name="mount-fails-right-away"></a>

檔案系統掛載命令會立即失敗。下列代碼顯示了範例。

```
mount.lustre: mount fs-0123456789abcdef0.fsx.us-east-1.aws@tcp:/fsx at /lustre
failed: No such file or directory

Is the MGS specification correct?
Is the filesystem name correct?
```

如果您在使用 **mount**命令掛載持久性或暫存 2 檔案系統時未使用正確的`mountname`值，則可能會發生此錯誤。您可以從 [https://docs.aws.amazon.com/cli/latest/reference/fsx/describe-file-systems.html](https://docs.aws.amazon.com/cli/latest/reference/fsx/describe-file-systems.html) AWS CLI 命令或 [https://docs.aws.amazon.com/fsx/latest/APIReference/API_DescribeFileSystems.html](https://docs.aws.amazon.com/fsx/latest/APIReference/API_DescribeFileSystems.html) API 操作的回應取得 `mountname`值。

## 檔案系統掛載停止回應，然後因逾時錯誤而失敗
<a name="mount-hangs-fails-timeout"></a>

檔案系統掛載命令停止回應一至兩分鐘，然後因逾時錯誤而失敗。

下列代碼顯示了範例。

```
sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx

[2+ minute wait here]
Connection timed out
```

可能會發生此錯誤，因為 Amazon EC2 執行個體或檔案系統的安全群組未正確設定。

**採取動作**

請確定檔案系統的安全群組具有 中指定的傳入規則[Amazon VPC 安全群組](limit-access-security-groups.md#fsx-vpc-security-groups)。

## 自動掛載失敗且執行個體沒有回應
<a name="lustre-automount-fails"></a>



在某些情況下，檔案系統的自動掛載可能會失敗，您的 Amazon EC2 執行個體可能會停止回應。

如果未宣告 `_netdev`選項，可能會發生此問題。如果 `_netdev` 遺失，Amazon EC2 執行個體可以停止回應。此結果是因為網路檔案系統在運算執行個體開始聯網後需要初始化。

**採取動作**  
如果發生此問題，請聯絡 AWS 支援。

## 檔案系統掛載在系統開機期間失敗
<a name="mount-fails-boot-up"></a>

檔案系統掛載在系統開機期間失敗。掛載是使用 自動執行`/etc/fstab`。未掛載檔案系統時，執行個體開機時間範圍的 syslog 中會顯示下列錯誤。

```
LNetError: 3135:0:(lib-socket.c:583:lnet_sock_listen()) Can't create socket: port 988 already in use
LNetError: 122-1: Can't start acceptor on port 988: port already in use
```

當連接埠 988 無法使用時，可能會發生此錯誤。當執行個體設定為掛載 NFS 檔案系統時，NFS 掛載可能會將其用戶端連接埠繫結至連接埠 988

**採取動作**

您可以盡可能調校 NFS 用戶端的 `noresvport`和`noauto`掛載選項來解決此問題。

## 使用 DNS 名稱的檔案系統掛載失敗
<a name="mount-fails-dns-name"></a>

設定錯誤的網域名稱服務 (DNS) 名稱可能會導致檔案系統掛載失敗，如下列案例所示。

**案例 1：**使用網域名稱服務 (DNS) 名稱的檔案系統掛載失敗。下列代碼顯示了範例。

```
sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx
mount.lustre: Can't parse NID 
'file_system_dns_name@tcp:/mountname'
```

**採取動作**

檢查您的虛擬私有雲端 (VPC) 組態。如果您使用的是自訂 VPC，請確保 DNS 設定已啟用。如需詳細資訊，請參閱《Amazon VPC 使用者指南》**中的 [使用 DNS 與您的 VPC 搭配](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-dns.html)。

若要在`mount`命令中指定 DNS 名稱，請執行下列動作：
+ 確定 Amazon EC2 執行個體與您的 Amazon FSx for Lustre 檔案系統位於相同的 VPC 中。
+ 在設定為使用 Amazon 提供之 DNS 伺服器的 VPC 內連接 Amazon EC2 執行個體。如需詳細資訊，請參閱*《Amazon VPC 使用者指南》*中的 [DHCP 選項集](https://docs.aws.amazon.com/vpc/latest/userguide/VPC_DHCP_Options.html)。
+ 確定連線 Amazon EC2 執行個體的 Amazon VPC 已啟用 DNS 主機名稱。如需詳細資訊，請參閱《*Amazon* [VPC 使用者指南》中的更新 VPC 的 DNS 支援](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-dns.html#vpc-dns-updating)。

**案例 2：**使用網域名稱服務 (DNS) 名稱的檔案系統掛載失敗。下列代碼顯示了範例。

```
mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx
mount.lustre: mount file_system_dns_name@tcp:/mountname at /mnt/fsx failed: Input/output error Is the MGS running?
```

**採取動作**

 確定用戶端的 VPC 安全群組已套用正確的傳出流量規則。此建議適用於以下情況：如果您未使用預設安全群組，或如果您已修改預設安全群組。如需詳細資訊，請參閱[Amazon VPC 安全群組](limit-access-security-groups.md#fsx-vpc-security-groups)。