Amazon EMR Notebooks 概觀 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR Notebooks 概觀

注意

EMR Notebooks 可在 主控台中做為 EMR Studio Workspaces 使用。主控台中的建立工作區按鈕可讓您建立新的筆記本。若要存取或建立工作區,EMR Notebooks 使用者需要其他 IAM 角色許可。如需詳細資訊,請參閱 主控台中的 Amazon EMR Notebooks 是 Amazon EMR Studio WorkspacesAmazon EMR 主控台

可以使用 Amazon EMR Notebooks 以及執行 Apache Spark 的 Amazon EMR 叢集在 Amazon EMR 主控台內建立和開啟 Jupyter 筆記本和 JupyterLab 介面。EMR 筆記本是「無伺服器」筆記本,您可以使用它來執行查詢和程式碼。不同於傳統的筆記本,EMR 的內容在筆記本儲存格內的方程式、查詢、模型、程式碼和敘述性文字都會在用戶端中執行。這些命令會使用 EMR 叢集上的核心執行。筆記本的內容也會與叢集資料分開儲存到 Amazon S3,以提供耐用性並彈性地重複使用。

您可以啟動叢集,附接 EMR 筆記本進行分析,然後終止叢集。您也可以關閉連接到一個執行中叢集的筆記本,然後切換到另一個叢集。多位使用者可以同時將筆記本附接至同一個叢集,並彼此共用 Amazon S3 中的筆記本檔案。這些功能可讓您隨需執行叢集以節省成本,並減少針對不同叢集和資料集重新設定筆記本所花費的時間。

您也可以使用 Amazon EMR API 以程式設計方式執行 EMR 筆記本,而不需要與 Amazon EMR 主控台互動 (「無頭執行」)。需要在 EMR 筆記本中包含具有參數標籤的儲存格。該儲存格允許指令碼將新輸入值傳遞至筆記本。參數化筆記本可以與不同的輸入值集一起重複使用。不需要製作相同筆記本的複本,即可使用新的輸入值進行編輯和執行。對於參數化筆記本的每次執行,Amazon EMR 會在 S3 上建立並儲存輸出筆記本。如需 EMR 筆記本 API 程式碼範例,請參閱 EMR Notebooks 的程式設計命令範例

重要

EMR Notebooks 功能支援使用 Amazon EMR 5.18.0 及更高版本的叢集。建議您將 EMR Notebooks 與使用最新版本或至少 5.30.0、5.32.0 或 6.2.0 版 Amazon EMR 的叢集一起使用。使用這些版本,Jupyter 核心在附接的叢集上執行,而不是在 Jupyter 執行個體上。這可改善效能,並增強您自訂核心和程式庫的能力。如需詳細資訊,請參閱依叢集發行版本分類的功能差異

採用 Amazon S3 儲存和 Amazon EMR 叢集的適用費用。