翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker ノートブックインスタンスを作成する
重要
Amazon SageMaker Studio または Amazon SageMaker Studio Classic に Amazon SageMaker リソースの作成を許可するカスタム IAM ポリシーでは、これらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要になります。IAM ポリシーで Studio と Studio Classic によるリソースの作成が許可されていても、タグ付けが許可されていない場合は、リソースを作成しようとしたときに「AccessDenied」エラーが発生する可能性があります。詳細については、「SageMaker AI リソースにタグ付けのアクセス許可を付与する」を参照してください。
SageMaker リソースを作成するためのアクセス許可を付与する AWSAmazon SageMaker AI の マネージドポリシー には、それらのリソースの作成中にタグを追加するためのアクセス許可もあらかじめ含まれています。
Amazon SageMaker ノートブックインスタンスは、Jupyter Notebook アプリケーションを実行する ML コンピューティングインスタンスです。SageMaker AI は、インスタンスおよび関連リソースの作成を管理します。ノートブックインスタンスで Jupyter Notebook を使用して、次の操作を行います。
-
データの準備と処理
-
モデルをトレーニングするためのコードの記述
-
SageMaker AI ホスティングにモデルをデプロイする
-
モデルをテストまたは検証する
ノートブックインスタンスを作成するには、SageMaker AI コンソールか
CreateNotebookInstance API のいずれかを使用します。
選択するノートブックインスタンスタイプは、ノートブックインスタンスの使用方法によって異なります。ノートブックインスタンスがメモリ、CPU、または IO にバインドされていないことを確認してください。調査や前処理のためにデータセットをノートブックインスタンスのメモリ内にロードするには、データセット用の十分な RAM メモリがあるインスタンスタイプを選択します。これには、少なくとも 16 GB のメモリ (.xlarge 以上) を持つインスタンスが必要です。コンピューティング負荷の高い前処理にノートブックを使用する場合は、c4 や c5 などのコンピューティング最適化インスタンスを選択することをお勧めします。
SageMaker ノートブックを使用する場合のベストプラクティスは、ノートブックインスタンスを使用して他の AWSサービスをオーケストレーションすることです。例えば、ノートブックインスタンスを使用して大規模なデータセット処理を管理できます。これを行うには、Hadoop AWSを使用したマッピングとデータ削減のために Glue for ETL (抽出、変換、ロード) サービスまたは Amazon EMR を呼び出します。AWSサービスは、データの一時的な計算またはストレージとして使用できます。
Amazon Simple Storage Service バケットを使用して、トレーニングデータやテストデータを保存および取得できます。その後、SageMaker AI を使用してモデルをトレーニングおよび構築できます。そのため、ノートブックのインスタンスタイプは、モデルのトレーニングやテストの速度にまったく影響しません。
リクエストを受け取ると、SageMaker AI は次の処理を行います。
-
ネットワークインターフェイスを作成する - オプションの VPC 設定を選択した場合、SageMaker AI は、VPC にネットワークインターフェイスを作成します。リクエストで指定したサブネット ID を使って、サブネットを作成するアベイラビリティーゾーンを決定します。SageMaker AI は、リクエストでユーザーが指定したセキュリティグループをサブネットに関連付けます。詳細については、「VPC 内のノートブックインスタンスを外部リソースに接続する」を参照してください。
-
ML コンピューティングインスタンスを起動する - SageMaker AI は SageMaker AI VPC で ML コンピューティングインスタンスを起動します。SageMaker AI は、ノートブックインスタンスを管理する設定タスクを実行します。VPC を指定した場合、SageMaker AI は VPC とノートブックインスタンス間のトラフィックを有効にします。
-
一般的な深層学習プラットフォーム用の Anaconda パッケージとライブラリをインストールする - SageMaker AI は、インストーラに含まれているすべての Anaconda パッケージをインストールします。詳細については、「Anaconda パッケージリスト
」を参照してください。SageMaker AI はさらに、TensorFlow および Apache MXNet 深層学習ライブラリをインストールします。 -
ML ストレージボリュームをアタッチする - SageMaker AI は、ML ストレージボリュームを ML コンピューティングインスタンスにアタッチします。ボリュームを作業領域として使用して、トレーニングデータセットをクリーンアップしたり、検証やテスト、またはその他のデータを一時的に保存したりできます。ボリュームのサイズを 5 GB から 16384 GB の間で、1 GB 単位で選択します。デフォルトは 5 GB です。ML ストレージボリュームは暗号化されているため、SageMaker AI でボリューム上の使用可能な空き容量は判断できません。これにより、ボリュームのサイズを増やすことができますが、ノートブックインスタンスを更新するときに、ボリュームのサイズを小さくすることはできません。使用中の ML ストレージボリュームのサイズを小さくする場合は、目的のサイズで新しいノートブックインスタンスを作成します。
ノートブックインスタンスセッション間では、
/home/ec2-user/SageMakerフォルダ内に保存されたファイルとデータのみが保持されます。このディレクトリ外に保存されたファイルとデータは、ノートブックインスタンスが停止して再起動すると上書きされます。各ノートブックインスタンスの/tmpディレクトリは、インスタンスストアに最低 10 GB のストレージを提供します。インスタンスストアは、永続的ではない一時的なブロックレベルのストレージです。インスタンスが停止または再起動されると、SageMaker AI はディレクトリの内容とオペレーティングシステムのカスタマイズを削除します。この一時的なストレージは、ノートブックインスタンスのルートボリュームの一部です。ノートブックインスタンスが更新されず、安全でないソフトウェアが実行されている場合、SageMaker AI は定期的なメンテナンスの一環としてインスタンスを定期的に更新することがあります。これらの更新中、フォルダ外のデータは保持
/home/ec2-user/SageMakerされません。メンテナンスパッチとセキュリティパッチの詳細については、「」を参照してくださいメンテナンス。ノートブックインスタンスで使用されるインスタンスタイプが NVMe をサポートしている場合、お客様はそのインスタンスタイプで使用できる NVMe インスタンスストアボリュームを使用できます。NVMe ストアボリュームを使用するインスタンスタイプでは、すべてのインスタンスストアボリュームが、起動時に自動的にインスタンスにアタッチされます。インスタンスタイプおよび関連する NVMe ストアボリュームの詳細については、「Amazon Elastic Compute Cloud インスタンスタイプの詳細
」を参照してください。 アタッチされた NVMe ストアボリュームをノートブックインスタンスで使用可能にするには、「インスタンスへのインスタンスストアボリュームの追加」の手順を完了します。ルートアクセスまたはライフサイクル設定スクリプトを使用して、手順を完了します。
注記
NVMe インスタンスストアボリュームは永続的ストレージではありません。このストレージはインスタンスでは短寿命であるため、このストレージを持つインスタンスを起動するたびに再設定が必要になります。
SageMaker AI ノートブックインスタンスを作成するには:
-
SageMaker AI コンソール (https://console.aws.amazon.com/sagemaker/
) を開きます。 -
[ノートブックインスタンス] を選択して、[ノートブックインスタンスの作成] を選択します。
-
[ノートブックインスタンスの作成] ページで、次の情報を入力します。
-
[ノートブックインスタンス名] に、ノートブックインスタンスの名前を入力します。
-
[ノートブックインスタンスタイプ] で、ユースケースに適したインスタンスサイズを選択します。サポートされるインスタンスタイプとクォータについては、「Amazon SageMaker AI のクォータ」を参照してください。
-
[Platform Identifier] (プラットフォーム識別子) で、ノートブックインスタンスを作成するプラットフォームタイプを選択します。このプラットフォームタイプによって、ノートブックインスタンスの作成に使用するオペレーティングシステムと JupyterLab バージョンが決まります。Amazon Linux 2023 ノートブックインスタンス
notebook-al2023-v1の最新バージョンと推奨バージョンは です。2025 年 6 月 30 日現在、新しいインスタンスでサポートされるのは JupyterLab 4 のみです。プラットフォーム識別子タイプの詳細については、AL2023 ノートブックインスタンス「」および「」を参照してくださいAmazon Linux 2 ノートブックインスタンス。JupyterLab のバージョンの詳細については、「JupyterLab のバージョニング」を参照してください。重要
JupyterLab 1 と JupyterLab 3 は、2025 年 6 月 30 日をもってサポートが終了しました。これらのバージョンを使用して、新しいノートブックインスタンスを作成したり、停止したノートブックインスタンスを再起動したりすることはできなくなりました。既存のサービス中のインスタンスは引き続き機能する可能性がありますが、セキュリティ更新プログラムやバグ修正は受信されません。サポートを継続するには、JupyterLab 4 ノートブックインスタンスに移行してください。詳細については、「JupyterLab バージョンのメンテナンス」を参照してください。
-
(オプション) 上級ユーザーの場合、[追加設定] を使用して、インスタンスの作成または起動時に実行できるシェルスクリプトを作成できます。このスクリプトはライフサイクル設定スクリプトと呼ばれ、ノートブックの環境を設定したり、その他の関数を実行したりするために使用できます。詳細については、「LCC スクリプトを使用した SageMaker ノートブックインスタンスのカスタマイズ」を参照してください。
-
(オプション) [追加設定] では、ノートブックインスタンスにアタッチされている機械学習ストレージボリュームのサイズを GB 単位で指定することもできます。5 GB ~ 16,384 GB のサイズを 1 GB 単位で選択できます。ボリュームを使用してトレーニングデータセットをクリーンアップしたり、検証や他のデータを一時的に保存できます。
-
(オプション) [最小 IMDS バージョン] で、ドロップダウンリストからバージョンを選択します。この値を v1 に設定すると、両方のバージョンをノートブックインスタンスで使用できます。v2 を選択すると、IMDSv2 のみをノートブックインスタンスで使用できます。IMDSv2 の詳細については、「IMDSv2 の使用」を参照してください。
注記
2022 年 10 月 31 日以降、SageMaker ノートブックインスタンスのデフォルトの最小 IMDS バージョンは IMDSv1 から IMDSv2 に変更されます。
2023 年 2 月 1 日以降、IMDSv1 はノートブックインスタンスの新規作成に使用できなくなります。これ以降は、IMDS バージョン 2 以上でノートブックインスタンスを作成できます。
-
[IAM ロール] で、SageMaker AI リソースにアクセスするために必要なアクセス許可が付与されているアカウント内の既存の IAM ロールを選択するか、[新しいロールの作成] をクリックします。[新しいロールの作成] を選択すると、SageMaker AI は
AmazonSageMaker-ExecutionRole-という名前の IAM ロールを作成します。AWS管理ポリシーYYYYMMDDTHHmmSSAmazonSageMakerFullAccessはロールにアタッチされます。このロールは、ノートブックインスタンスが SageMaker AI および Amazon S3 を呼び出すことを許可するアクセス許可を付与します。 -
[ルートアクセス] で、すべてのノートブックインスタンスユーザーにルートアクセスを付与するには、[有効化] を選択します。ユーザーのルートアクセスを削除するには、[無効化] を選択します。ルートアクセスを付与すると、ノートブックインスタンスのすべてのユーザーに管理者権限が付与され、そのインスタンス上のすべてのファイルにアクセスして編集できるようになります。
-
(オプション) 暗号化キーを使用すると、AWS Key Management Service (AWS KMS) キーを使用して、ノートブックインスタンスにアタッチされた機械学習ストレージボリューム上のデータを暗号化できます。機密情報を機械学習ストレージボリュームに保存する場合は、情報を暗号化することを検討してください。
-
(オプション) [ネットワーク] を使用すると、ノートブックインスタンスを Virtual Private Cloud (VPC) 内に配置できます。VPC はセキュリティを強化し、VPC 内のリソースへの VPC 外のソースからのアクセスを制限します。VPC の詳細については、「Amazon VPC ユーザーガイド」を参照してください。
ノートブックインスタンスを VPC に追加するには:
-
[VPC] と [SubnetId] を選択します。
-
[セキュリティグループ] で、VPC のデフォルトのセキュリティグループを選択します。
-
ノートブックインスタンスにインターネットアクセスが必要な場合は、直接インターネットアクセスを有効にします。[直接インターネットアクセス] で [有効化] を選択します。インターネットアクセスにより、ノートブックインスタンスの安全性が低下する可能性があります。詳細については、「VPC 内のノートブックインスタンスを外部リソースに接続する」を参照してください。
-
-
(オプション) Git リポジトリをノートブックインスタンスに関連付けるには、デフォルトのリポジトリと最大 3 つの追加リポジトリを選択します。詳細については、「SageMaker AI ノートブックインスタンスを含む Git リポジトリ」を参照してください。
-
[Create notebook instance] (ノートブックインスタンスの作成) を選択します。
数分以内に、Amazon SageMaker AI は ML コンピューティングインスタンス (この場合はノートブックインスタンス) を起動し、これに ML ストレージボリュームをアタッチします。ノートブックインスタンスには、事前設定された Jupyter ノートブックサーバーと一連の Anaconda ライブラリがあります。詳細については、「
CreateNotebookInstanceAPI」を参照してください。
-
-
コンソールでノートブックインスタンスのステータスが
InServiceの場合、ノートブックインスタンスを使用する準備ができています。ノートブック名の横にある [Jupyter を開く] を選択して、クラシック Jupyter ダッシュボードを開きます。注記
Amazon SageMaker ノートブックインスタンスのセキュリティを強化するため、すべてのリージョンの
ドメインはインターネットのパブリックサフィックスリスト (PSL)notebook.region.sagemaker.awsに登録されます。セキュリティをさらに強化するには、 __Host-プレフィックス付きの Cookie を使用して、SageMaker ノートブックインスタンスのドメインに機密 Cookie を設定することをお勧めします。これは、クロスサイトリクエストフォージェリ (CSRF) 攻撃からドメインを防ぐ際に役立ちます。詳細については、mozilla.orgのデベロッパー向けドキュメントウェブサイトの Set-Cookie ページを参照してください。 [JupyterLab を開く] を選択すると、JupyterLab ダッシュボードが開きます。ダッシュボードからノートブックインスタンスにアクセスできます。
Jupyter ノートブックの詳細については、Jupyter ノートブック
を参照してください。