本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将 Git-based 存储库与 EMR Notebooks 关联起来
您可以将 Git-based 存储库与您的 Amazon EMR 笔记本关联起来,将您的笔记本保存在版本控制的环境中。一个 Notebook 最多可与三个存储库关联。支持以下 Git-based 服务:
注意
EMR Notebooks 在控制台中作为 Amazon EMR Studio Workspaces 提供。通过控制台中的创建 Workspace 按钮,可以创建新的 Notebooks。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR Notebooks 是控制台中的 Amazon EMR Studio Workspaces 和 Amazon EMR 控制台。
将 Git-based 存储库与笔记本关联有以下好处。
-
版本控制:您可以在版本控制系统中记录代码更改,以便查看更改历史记录并有选择地撤消一些更改。
-
协作 — 使用不同笔记本工作的同事可以通过远程存储库共享代码。 Git-based Notebooks 可以从远程存储库克隆或合并代码,然后将更改推送回这些远程存储库。
-
代码重用 — 许多演示数据分析或机器学习技术的 Jupyter 笔记本都可以在公共托管的存储库中找到,例如。 GitHub可以将您的 Notebooks 与存储库关联,以便重用包含在该存储库中的 Jupyter Notebooks。
要将 Git-based 存储库与 EMR Notebooks 配合使用,您可以将存储库作为资源添加到 Amazon EMR 控制台中,关联需要身份验证的存储库的凭证,然后将其与您的笔记本关联。您可在 Amazon EMR 控制台中查看存储在账户中的存储库列表以及各个存储库的详细信息。在创建现有 Git-based 存储库时,可以将其与笔记本关联。