

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将基于 Git 的存储库链接到 EMR Studio Workspace
<a name="emr-studio-git-repo"></a>

最多可将三个基于 Git 的存储库与 Amazon EMR Studio Workspace 关联起来，以保存和共享 Notebook 文件。

## 关于 EMR Studio 的 Git 存储库
<a name="emr-studio-git-repo-about"></a>

您最多可以将三个 Git 存储库与一个 EMR Studio Workspace 相关联。默认情况下，每个工作区都允许您从与 Studio 同一个 AWS 帐户关联的 Git 存储库列表中进行选择。您还可以创建新的 Git 存储库作为 Workspace 资源。

在连接到集群的主节点时，您可以使用终端命令运行如下所示的 Git 命令。

```
!git pull origin <branch-name>
```

此外，您也可以使用 jupyterlab-git 扩展程序。从左侧边栏中选择 **Git** 图标打开它。[有关 jupyterlab-git 扩展的信息，请参阅 jupyterlab-git。 JupyterLab](https://github.com/jupyterlab/jupyterlab-git)

## 先决条件
<a name="emr-studio-git-prereqs"></a>
+ 要将 Git 存储库与 Workspace 关联，Studio 必须配置为允许 Git 存储库链接。您的 Studio 管理员应该执行[为基于 Git 的存储库建立访问和权限](emr-studio-enable-git.md)中所述的步骤。
+ 如果您使用 CodeCommit 存储库，则必须使用 Git 凭据和 HTTPS。不支持 SSH 密钥和带有 AWS Command Line Interface 凭证助手的 HTTPS。 CodeCommit 也不支持个人访问令牌 (PATs)。有关更多信息，请参阅 [IAM 用户指南 CodeCommit中的 “将 IAM 与一起使用](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_credentials_ssh-keys.html)*” 和 “用户指南*[” 中的 “使用 Git 凭证的 HTTPS *AWS CodeCommit 用户*设置](https://docs.aws.amazon.com/codecommit/latest/userguide/setting-up-gc.html)”。

## 说明
<a name="emr-studio-link-git-repo"></a>

**将关联的 Git 存储库链接到 Workspace**

1. 从 Studio 的 **Workspaces** 列表中打开要链接到存储库的 Workspace。

1. 从左侧边栏中选择 **Amazon EMR Git 存储库**图标打开 **Git 存储库**工具面板。

1. 在 **Git repositories (Git 存储库)** 下，展开下拉列表并最多选择三种存储库以链接到 Workspace。EMR Studio 注册您的选择并开始链接每个存储库。

链接过程可能需要一些时间才能完成。您可以在 **Git repository (Git 存储库)** 工具面板中查看您选择的每个存储库的状态。EMR Studio 将存储库链接到 Workspace 后，您应该会在 **File browser (文件浏览器)** 面板中看到属于该存储库的文件。

**将新的 Git 存储库作为资源添加到 Workspace**

1. 从 Studio 的 Workspaces 列表中打开要链接到存储库的 Workspace。

1. 从左侧边栏中选择 **Amazon EMR Git 存储库**图标打开 **Git 存储库**工具面板。

1. 选择 **Add new Git repository (添加新的 Git 存储库)**。

1. 对于 **Repository name (存储库名称)**，输入 EMR Studio 中存储库的描述性名称。名称只能包含字母数字字符、连字符和下划线。

1. 对于 **Git repository URL (Git 存储库 URL)**，输入存储库的 URL。使用 CodeCommit 存储库时，这是在您选择 “克隆 URL” 然后选择 “**克**隆 HTTPS**” 时复制的 URL**。例如 `https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName]`。

1. 对于 **Branch (分支)**，输入要签出的现有分支的名称。

1. 对于 Git credentials (Git 凭证)，请根据以下准则选择选项。EMR Studio 使用存储在 Secrets Manager 中的密钥访问您的 Git 凭证。
**注意**  
如果您使用 GitHub 存储库，我们建议您使用个人访问令牌 (PAT) 进行身份验证。从 2021 年 8 月 13 日起， GitHub 将要求基于令牌的身份验证，并且在对 Git 操作进行身份验证时将不再接受密码。有关更多信息，请参阅博客上的 [Git 操作令牌身份验证要求 GitHub ](https://github.blog/2020-12-15-token-authentication-requirements-for-git-operations/)*文章*。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/emr/latest/ManagementGuide/emr-studio-git-repo.html)

1. 选择 **Add repository (添加存储库)** 创建新存储库。EMR Studio 创建新存储库后，您将看到一条成功消息。新存储库显示在 **Git repositories (Git 存储库)** 下的下拉列表中。

1. 要将新存储库链接到您的 Workspace，请从 **Git repositories (Git 存储库)** 下的下拉列表中选择它。

链接过程可能需要一些时间才能完成。在 EMR Studio 将新存储库链接到 Workspace 后，您应该会在 **File Browser (文件浏览器)** 面板中看到一个与您的存储库同名的新文件夹。

要打开不同的链接存储库，请在 **File browser (文件浏览器)** 中导航到其文件夹。