本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
教學課程:設定 SAP NetWeaver 的監控
本教學課程示範如何設定 Amazon CloudWatch Application Insights,以設定 SAP NetWeaver 的監控。您可以使用 CloudWatch Application Insights 自動儀表板,以視覺化方式呈現問題詳細資訊、加速疑難排解,並減少 SAP NetWeaver 應用程式伺服器的平均解決時間 (MTTR)。
適用於 SAP NetWeaver 的 CloudWatch Application Insights 目錄
支援的環境
CloudWatch Application Insights 支援下列系統和模式 AWS 的資源部署。
-
SAP NetWeaver 標準系統部署。
-
在多個 Amazon EC2 執行個執行個體上的 SAP NetWeaver 分散式部署。
-
跨可用區域 SAP NetWeaver 高可用性設定:使用 SUSE/RHEL 叢集跨兩個可用區域設定高可用性的 SAP NetWeaver。
支援的作業系統
適用於 SAP NetWeaver 的 CloudWatch Application Insights 支援下列作業系統:
-
Oracle Linux 8
-
Red Hat Enterprise Linux 7.6
-
Red Hat Enterprise Linux 7.7
-
Red Hat Enterprise Linux 7.9
-
Red Hat Enterprise Linux 8.1
-
Red Hat Enterprise Linux 8.2
-
Red Hat Enterprise Linux 8.4
-
Red Hat Enterprise Linux 8.6
-
SUSE Linux Enterprise Server 15 for SAP
-
SUSE Linux Enterprise Server 15 SP1 for SAP
-
SUSE Linux Enterprise Server 15 SP2 for SAP
-
SUSE Linux Enterprise Server 15 SP3 for SAP
-
SUSE Linux Enterprise Server 15 SP4 for SAP
-
SUSE Linux Enterprise Server 12 SP4 for SAP
-
SUSE Linux Enterprise Server 12 SP5 for SAP
-
SUSE Linux Enterprise Server 15,高可用性模式除外
-
SUSE Linux Enterprise Server 15 SP1,高可用性模式除外
-
SUSE Linux Enterprise Server 15 SP2,高可用性模式除外
-
SUSE Linux Enterprise Server 15 SP3,高可用性模式除外
-
SUSE Linux Enterprise Server 15 SP4,高可用性模式除外
-
SUSE Linux Enterprise Server 12 SP4,高可用性模式除外
-
SUSE Linux Enterprise Server 12 SP5,高可用性模式除外
功能
適用於 SAP NetWeaver 7.0x–7.5x 的 CloudWatch Application Insights (包含 ABAP 平台) 提供下列功能:
-
自動 SAP NetWeaver 工作負載偵測
-
根據靜態閾值自動建立 SAP NetWeaver 警示
-
自動 SAP NetWeaver 日誌模式辨識
-
SAP NetWeaver 的運作狀態儀表板
-
SAP NetWeaver 的問題儀表板
先決條件
您必須滿足以下先決條件,才能使用 CloudWatch Application Insights 設定 SAP NetWeaver:
-
AWS Systems Manager 啟用 – 在 Amazon EC2 執行個體上安裝 SSM Agent,並啟用 SSM 執行個體。如需有關如何安裝 SSM Agent 的資訊,請參閱《AWS Systems Manager 使用者指南》中的設定 AWS Systems Manager。
-
Amazon EC2 執行個體角色:您必須連接下列 Amazon EC2 執行個體角色才能設定 SAP NetWeaver 監控。
-
您必須連接
AmazonSSMManagedInstanceCore
角色,以啟用 Systems Manager。如需詳細資訊,請參閱 AWS Systems Manager 以身分為基礎的政策範例。 -
您必須連接
CloudWatchAgentServerPolicy
政策,以便透過 CloudWatch 發出執行個體指標和日誌。如需詳細資訊,請參閱《建立 IAM 角色和使用者以使用 CloudWatch 代理程式》。
-
-
AWS 資源群組 – 您必須建立資源群組,其中包含應用程式堆疊用於將應用程式加入 CloudWatch Application Insights 的所有相關 AWS 資源。這包括在 SAP NetWeaver 應用程式伺服器上執行的 Amazon EC2 執行個體、Amazon EFS 和 Amazon EBS 磁碟區。如果每個帳戶有多個 SAP NetWeaver 系統,我們建議您建立一個資源群組,其中包含每個 SAP NetWeaver 系統 AWS 的資源。如需有關建立資源群組的詳細資訊,請參閱《AWS 資源群組和標籤使用者指南》。
-
IAM 許可 – 對於沒有管理存取權的使用者,您必須建立允許 Application Insights 建立服務連結角色並將其連接到使用者身分的 AWS Identity and Access Management (IAM) 政策。如需有關如何建立政策的更多資訊,請參閱 IAM 政策。
-
服務連結角色 – Application Insights 使用 AWS Identity and Access Management (IAM) 服務連結角色。系統會在您於 Application Insights 主控台建立第一個 Application Insights 應用程式時,為您建立服務連結角色。如需詳細資訊,請參閱針對 CloudWatch Application Insights 使用服務連結角色。
-
Amazon CloudWatch 代理程式 — Application Insights 會安裝並設定 CloudWatch 代理程式。若您已安裝 CloudWatch 代理程式,Application Insights 會保留您的組態。若要避免合併衝突,請從現有的 CloudWatch 代理程式組態檔案中移除您要在 Application Insights 中使用的資源組態。如需詳細資訊,請參閱手動建立或編輯 CloudWatch 代理程式組態檔案。
設定 SAP NetWeaver 應用程式伺服器以進行監控
使用下列步驟為 SAP NetWeaver 應用程式伺服器設定監控。
設定監控
-
開啟 CloudWatch 主控台
。 -
在左側導覽窗格中,選取 Insights 下的 Application Insights。
-
Application Insights 頁面會顯示 Application Insights 監控的應用程式清單,以及每個應用程式的監控狀態。在右上角,選取 Add an application (新增應用程式)。
-
在 Specify application details (指定應用程式詳細資訊) 頁面上,從 Resource group (資源群組) 的下拉式清單中選取您建立的 AWS 資源群組,其中包含您的 SAP NetWeaver 資源。如果尚未建立應用程式的資源群組,您可以透過選擇 Resource group (資源群組) 下拉式清單中的 Create new resource group (建立新的資源群組) 建立一個。
-
在 Automatic monitoring of new resources (自動監控新資源) 下,選取核取方塊,以允許 Application Insights 在加入後自動監控新增至應用程式資源群組的資源。
-
在監控 EventBridge 事件下,選取核取方塊,將 Application Insights 監控與 CloudWatch Events 整合,以取得來自 Amazon EBS、Amazon EC2、 AWS CodeDeploy、Amazon ECS、 AWS Health APIs和通知、Amazon RDS、Amazon S3 和 的洞見 AWS Step Functions。
-
在與 AWS Systems Manager OpsCenter 整合下,選取 Generate AWS Systems Manager OpsCenter OpsItems 旁的核取方塊,以便在偵測到所選應用程式的問題時,檢視和取得通知。若要追蹤為了解決與 AWS 資源相關的操作工作項目而執行的操作,稱為 OpsItems,請提供 SNS 主題 ARN。
-
您可以選擇輸入標籤協助您識別和整理資源。CloudWatch Application Insights 支援標籤型和 AWS CloudFormation 堆疊型資源群組,但 Application Auto Scaling 群組除外。如需詳細資訊,請參閱 AWS Resource Groups 和標籤使用者指南中的標籤編輯器。
-
若要檢閱偵測到的元件,請選擇下一步。
-
在檢閱偵測到的元件頁面上,系統會列出 CloudWatch Application Insights 自動偵測到的受監控元件及其工作負載。
-
若要編輯工作負載類型和名稱,請選擇編輯元件。
注意
包含偵測到的 NetWeaver 分散式或 NetWeaver 高可用性工作負載的元件,一個元件上僅支援一個工作負載。
-
-
選擇 Next (下一步)。
-
在 Specify component details (指定元件詳細資訊) 頁面上,選擇 Next (下一步)。
-
檢閱您的應用程式監控組態,然後選擇提交。
-
應用程式詳細資訊頁面隨即開啟,您可以在其中檢視應用程式摘要、儀表板、元件和工作負載。您也可以檢視 Configuration history (組態歷史記錄)、Log patterns (日誌模式),以及任何已建立的 Tags (標籤)。您提交應用程式之後,CloudWatch Application Insights 會為 SAP NetWeaver 系統部署所有指標和警示,這最多可能需要一小時。
管理 SAP NetWeaver 應用程式伺服器的監控
使用下列步驟管理 SAP NetWeaver 應用程式伺服器的監控。
管理監控
-
開啟 CloudWatch 主控台
。 -
在左側導覽窗格中,選取 Insights 下的 Application Insights。
-
選擇 List view (清單檢視) 索引標籤。
-
Application Insights 頁面會顯示 Application Insights 監控的應用程式清單,以及每個應用程式的監控狀態。
-
選取您的應用程式。
-
選擇 Components (元件) 索引標籤。
-
在 Monitored components (受監控元件) 下,選取元件名稱旁的選項按鈕。然後,選取 Manage monitoring (管理監控)。
-
在 Instance logs (執行個體日誌) 下,您可以更新現有的日誌路徑、日誌模式集和日誌群組名稱。此外,您可以新增最多三個額外 Application logs (應用程式日誌)。
-
在 Metrics (指標) 下,您可以根據需求選取 SAP NetWeaver 指標。SAP NetWeaver 指標名稱的字首為
sap
。每個元件最多可新增 40 個指標。 -
在 Custom alarms (自訂警示) 下,您可以新增其他警示,以便由 CloudWatch Application Insights 監控。
-
檢閱您的應用程式監控組態,然後選擇 Save (儲存)。您提交組態後,您的帳戶會為 SAP NetWeaver 系統更新所有指標和警示。
檢視 CloudWatch Application Insights 偵測到的 SAP NetWeaver 問題並進行疑難排解
下列各節提供的步驟可協助您解決在 Application Insights 上設定 SAP NetWeaver 監控時所發生的常見疑難排解案例。
SAP NetWeaver 資料庫連線問題
描述
您的 SAP NetWeaver 應用程式遇到資料庫連線問題。
原因
您可以前往 CloudWatch Application Insights 主控台,並檢查 SAP NetWeaver Application Insights 問題儀表板,以識別連線問題。選取 Problem summary (問題摘要) 下方的連結,即可查看特定問題。

在下列範例中,在 Problem summary (問題摘要) 下,SAP:可用性是問題所在。

緊接在 Problem summary (問題摘要) 之後,Insight 區段會提供有關錯誤以及您可以從何處取得有關問題原因的詳細資訊。

在此相同的問題儀表板上,您可以檢視問題偵測功能已進行分組的相關日誌和指標,以協助您隔離錯誤的原因。sap_alerts_Availability
指標會追蹤 SAP NetWeaver 系統在一段時間內的可用性。您可以使用歷史追蹤來關聯指標何時啟動錯誤狀態或超出警示閾值。在下列範例中,SAP NetWeaver 系統出現可用性問題。此範例會顯示兩個警示,因為有兩個 SAP 應用程式伺服器執行個體,已針對每個執行個體建立一個警示。

如需有關每個警示的詳細資訊,請將滑鼠游標暫留在 sap_alerts_Availability
指標名稱上。

在下列範例中,sap_alerts_Database
指標顯示資料庫層發生問題或故障。此警示表示 SAP NetWeaver 在連線至其資料庫或與其資料庫進行通訊時發生問題。

由於資料庫是 SAP NetWeaver 的重要資源,因此當資料庫發生問題或故障時,您可能會收到許多相關警示。在下列範例中,因為無法使用資料庫,所以會啟動 sap_alerts_FrontendResponseTime
和 sap_alerts_LongRunners
指標。

解決方案
Application Insights 會每小時監控偵測到的問題。如果 SAP NetWeaver 日誌檔案中沒有新的相關日誌項目,較舊的日誌項目會被視為已解決。您必須修正與 CloudWatch 警示相關的任何錯誤情況。修復錯誤條件後,當警示和日誌復原時,警示就會解決。所有 CloudWatch 日誌錯誤和警示都解決後,Application Insights 會停止偵測錯誤,並在一小時內自動解決問題。我們建議您解決所有日誌錯誤狀況和警示,以便在問題儀表板上找到最新的問題。
在下列範例中,SAP 可用性問題已解決。

SAP NetWeaver 應用程式可用性問題
描述
SAP NetWeaver 高可用性排入佇列複寫已停止運作。
原因
您可以前往 CloudWatch Application Insights 主控台,並檢查 SAP NetWeaver Application Insights 問題儀表板,以識別連線問題。選取 Problem summary (問題摘要) 下方的連結,即可查看特定問題。

在下列範例中,在 Problem summary (問題摘要) 下,高可用性排入佇列複寫就是問題所在。

緊接在 Problem summary (問題摘要) 之後,Insight 區段會提供有關錯誤以及您可以從何處取得有關問題原因的詳細資訊。

下列範例顯示問題儀表板,您可以在其中檢視日誌和指標,這些日誌和指標會分組以協助您隔離錯誤的原因。sap_enqueue_server_replication_state
指標會追蹤一段時間內的值。您可以使用歷史追蹤來關聯指標何時啟動錯誤狀態或超出警示閾值。

在下列範例中,ha_cluster_pacemaker_fail_count
指標會顯示高可用性 Pacemaker 叢集發生資源故障。失敗計數大於或等於 1 的特定 Pacemaker 資源會在元件儀表板中識別出來。

下列範例顯示 sap_alerts_Shortdumps
指標,表示偵測到問題時,SAP 應用程式效能已降低。

日誌
日誌項目有助於更好地了解偵測到問題時發生在 SAP NetWeaver 層的問題。問題儀表板中的日誌群組小工具會顯示問題的具體時間。

若要查看有關日誌的詳細資訊,請選取右上角的三個垂直點,然後在 View in CloudWatch Logs Insights (在 CloudWatch Logs Insights 中檢視)。

使用下列步驟來取得有關問題儀表板中顯示之指標和警示的詳細資訊。
取得指標和警示的詳細資訊
-
開啟 CloudWatch 主控台
。 -
在左側導覽窗格中,選取 Insights 下的 Application Insights。然後,選擇 List view (清單檢視) 索引標籤,然後選擇您的應用程式。
-
選取 Components (元件) 索引標籤。然後,選取您要取得其詳細資訊的 SAP NetWeaver 元件。
下列範例會顯示 HA Metrics (HA 指標) 區段,其中包含顯示在問題儀表板中的
ha_cluster_pacemaker_fail_count
指標。
解決方案
Application Insights 會每小時監控偵測到的問題。如果 SAP NetWeaver 日誌檔案中沒有新的相關日誌項目,較舊的日誌項目會被視為已解決。您必須修正與此問題相關的任何錯誤情況。
針對 sap_alerts_Shortdumps
警示,您必須使用交易程式碼 RZ20 → R3Abap →
Shortdumps
導覽至 CCMS 提醒來解決 SAP NetWeaver 系統中的提醒。如需有關 CCMS 提醒的詳細資訊,請參閱 SAP 網站
所有 CloudWatch 日誌錯誤和警示都解決後,Application Insights 會停止偵測錯誤,並在一小時內自動解決問題。我們建議您解決所有日誌錯誤狀況和警示,以便在問題儀表板上找到最新的問題。在下列範例中,SAP Netweaver 高可用性排入佇列複寫問題已解決。

適用於 SAP NetWeaver 的 Application Insights 的疑難排解
本節提供的步驟可協助您解決 Application Insights 儀表板所傳回的常見錯誤。
無法新增超過 60 個監控指標
傳回錯誤:Component cannot have more than 60 monitored metrics.
根本原因:The current metric limit is 60 monitor metrics per component.
解決方案:移除不需要遵守限制的指標。
SAP 指標在加入程序之後不會顯示在儀表板上
根本原因:元件儀表板使用五分鐘的指標期間來彙總資料點。
解決方案:五分鐘後,所有指標都應顯示在儀表板上。
SAP 指標和警示不會顯示在儀表板上
使用下列步驟來確定為什麼 SAP 指標和警示在加入程序之後不會顯示在儀表板上。
識別有指標與警示的問題
-
開啟 CloudWatch 主控台
。 -
在左側導覽窗格中,選取 Insights 下的 Application Insights。然後,選擇 List view (清單檢視) 索引標籤,然後選擇您的應用程式。
-
選擇 Configuration history (組態歷史紀錄) 索引標籤。
-
如果您看到遺失的指標資料點,請檢查與
prometheus-sap_host_exporter
相關的錯誤。 -
如果在上一個步驟中找不到錯誤,Connect to your Linux instance (連線到您的 Linux 執行個體)。對於高可用性部署,請連線到主叢集 Amazon EC2 執行個體。
-
在您的執行個體中,請使用下列命令確認匯出程式是否正在執行。預設連接埠為
9680
。如果您使用其他連接埠,請使用您正在使用的連接埠取代9680
。curl localhost:9680/metrics
如果沒有傳回任何資料,則匯出程式無法啟動。
-
若要尋找接下來兩個步驟
WORKLOAD_SHORT_NAME
中用於 的正確命名慣例,請執行下列命令。注意
Application Insights 會根據執行中的工作負載,
WORKLOAD_SHORT_NAME
將尾碼 新增至服務名稱。NetWeaver 分散式、標準和高可用性部署的簡短名稱為SAP_NWD
、SAP_NWS
和SAP_NWH
。sudo systemctl | grep exporter
-
若要檢查匯出器服務日誌中的錯誤,請執行下列命令:
sudo journalctl -e --unit=prometheus-sap_host_exporter_
WORKLOAD_SHORT_NAME
.service -
若要檢查匯出工具管理員服務日誌中的錯誤,請執行下列命令:
sudo journalctl -e --unit=prometheus-sap_host_exporter_manager_
WORKLOAD_SHORT_NAME
.service注意
此服務應該始終啟動並運行。
如果此命令沒有傳回錯誤,則繼續下一個步驟。
-
若要手動啟動匯出器,請執行下列命令。然後,檢查匯出程式輸出。
sudo /opt/aws/sap_host_exporter/sap_host_exporter
您可以在檢查錯誤後結束匯出程式程序。
根本原因:此問題有數個可能的原因。常見的原因是匯出程式無法連線到其中一個應用程式伺服器執行個體。
解決方案
請使用下列步驟將匯出程式連線至應用程式伺服器執行個體。您需要驗證 SAP 應用程式執行個體是否正在執行,並使用 SAPControl 連線至執行個體。
將匯出程式連線至應用程式伺服器執行個體
-
在您的 Amazon EC2 執行個體中,執行下列命令以驗證 SAP 應用程式是否正在執行。
sapcontrol -nr <App_InstNo> -function GetProcessList
-
您必須建立有效的 SAPControl 連線。如果 SAPControl 連線無法運作,請在相關 SAP 應用程式執行個體上找出問題的根本原因。
-
若要在修正 SAPControl 連線問題後手動啟動匯出程式,請執行下列命令:
sudo systemctl start prometheus-sap_host_exporter.service
-
如果您無法解決 SAPControl 連線問題,請使用下列程序作為暫時修正。
-
在左側導覽窗格中,選擇 State Manager。
-
在 Associations (關聯) 下,搜尋 SAP NetWeaver 系統的關聯。
Association Name: Equal: AWS-ApplicationInsights-SSMSAPHostExporterAssociationForCUSTOMSAPNW<SID>-1
-
選取 Association ID (關聯 ID)。
-
選擇 Parameters (參數) 索引標籤,然後從 additionalArguments 中移除應用程式伺服器編號。
-
選擇 Apply association now (立即套用關聯)。
注意
這是暫時的修正程式。如果對元件的監視組態進行了更新,則會重新新增執行個體。