本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
(可选)迁移自定义映像和生命周期配置
您必须更新自定义映像和生命周期配置 (LCC) 脚本,才能在 Amazon SageMaker Studio 中使用简化的本地运行模型。如果您尚未在域中创建自定义映像或生命周期配置,请跳过此阶段。
Amazon SageMaker Studio Classic 在分体式环境中运行,
-
运行 Jupyter Server 的
JupyterServer
应用程序。 -
在一个或多个
KernelGateway
应用程序上运行的 Studio Classic 笔记本电脑。
Studio 已经摆脱了分离式环境。Studio 在本地运行时模型中运行基于 Code-OSS、Visual Studio Code-开源应用程序的 JupyterLab 和代码编辑器。有关架构变更的更多信息,请参阅在 Amazon SageMaker Studio 上提高工作效率
迁移自定义映像
您现有的 Studio Classic 自定义映像可能无法在 Studio 中使用。我们建议创建满足在 Studio 中使用要求的新自定义映像。Studio 的发布通过提供,简化了构建自定义映像的过程SageMaker 工作室图片支持政策。 SageMaker AI Distribution 图像包括用于机器学习、数据科学和数据分析可视化的常用库和软件包。有关基本 SageMaker 分发映像列表和 Amazon Elastic Container Registry 账户信息,请参阅亚马逊 SageMaker 图片可用于 Studio Classic。
要构建自定义映像,请完成以下操作之一。
-
使用自定义包和模块扩展 SageMaker 分发映像。这些图像预先配置了代码编辑器,基于 Code-OSS、Visual Studio Code-Open Source。 JupyterLab
-
按照 自带映像(BYOI) 中的说明创建自定义 Dockerfile 文件。您必须在映像上安装 JupyterLab 和开源 CodeServer,使其与 Studio 兼容。
迁移生命周期配置
由于 Studio 中简化了本地运行时模型,因此我们建议迁移现有 Studio Classic 的结构 LCCs。在 Studio Classic 中,您通常需要为 KernelGateway 和 JupyterServer 应用程序创建单独的生命周期配置。由于JupyterServer和KernelGateway应用程序在 Studio Classic 中的不同计算资源上运行,因此 Studio Classic LCCs 可以是以下任一类型:
-
JupyterServerLCC:它们 LCCs 主要控制用户的主控操作,包括设置代理、创建环境变量和自动关闭资源。
-
KernelGatewayLCC:这些 LCCs 控制了 Studio Classic 笔记本电脑环境的优化。这包括更新
Data Science 3.0
内核中的 numpy 软件包版本和在Pytorch 2.0 GPU
内核中安装 snowflake 软件包。
在简化的 Studio 架构中,您只需要一个在应用程序启动时运行的 LCC 脚本。虽然 LCC 脚本的迁移因开发环境而异,但我们建议合并JupyterServer并KernelGateway LCCs 构建一个组合的 LCC。
LCCs 在 Studio 中可以与以下应用程序之一相关联:
-
JupyterLab
-
代码编辑器
用户可以在创建空间时为相应的应用程序类型选择 LCC,也可以使用管理员设置的默认 LCC。
注意
现有的 Studio Classic 自动关闭脚本不能与 Studio 一起使用。有关 Studio 自动关闭脚本的示例,请参阅 SageMaker Studio 生命周期配置示例
重构时的注意事项 LCCs
在重构时,请考虑 Studio Classic 和 Studio 之间的以下区别。 LCCs
-
JupyterLab 而且,代码编辑器应用程序在创建后将
sagemaker-user
与UID:1001
和一样运行GID:101
。默认情况下,sagemaker-user
具有承担权限的 sudo/root 权限。 KernelGateway默认情况下,应用程序root
按默认方式运行。 -
SageMaker 内部运行的分发映像 JupyterLab 和代码编辑器应用程序使用Debian基于的包管理器
apt-get
。 -
Studio JupyterLab 和代码编辑器应用程序使用Conda包管理器。 SageMaker 启动 Studio 应用程序时,AI 会创建单一基础Python3Conda环境。有关更新基础 Conda 环境中的软件包和创建新 Conda 环境的信息,请参阅 JupyterLab 用户指南。相反,并非所有 KernelGateway 应用程序都使用 Conda 用作软件包管理器。
-
Studio JupyterLab 应用程序使用
JupyterLab 4.0
,而 Studio 经典应用程序使用JupyterLab 3.0
。验证您使用的所有 JupyterLab 扩展程序是否与JupyterLab 4.0
兼容。有关扩展的更多信息,请参阅扩展与 JupyterLab 4.0 的兼容性。