ユーザースクリプトと仮想環境を S3 に保存する - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ユーザースクリプトと仮想環境を S3 に保存する

次の手順では、ユーザースクリプトとオプションの仮想環境を Amazon S3 に保存する方法を説明します。PySpark 分析テンプレートを作成する前に、このステップを完了します。

重要

分析テンプレートの作成後にアーティファクト (ユーザースクリプトまたは仮想環境) を変更または削除しないでください。

これを行うと、次のようになります。

  • このテンプレートを使用する今後のすべての分析ジョブが失敗します。

  • 新しいアーティファクトを使用して新しい分析テンプレートを作成する必要があります。

  • 以前に完了した分析ジョブには影響しない

前提条件

  • 適切なアクセス許可 AWS アカウント を持つ

  • ユーザースクリプトファイル ( などmy_analysis.py)

  • (オプション、存在する場合) 仮想環境パッケージ (.tar.gz ファイル)

  • IAM ロールを作成または変更するためのアクセス

Console
コンソールを使用してユーザースクリプトと仮想環境を S3 に保存するには:
  1. にサインイン AWS マネジメントコンソール し、https://console.aws.amazon.com/s3/ で Amazon S3 コンソールを開きます。

  2. 新しい S3 バケットを作成するか、既存のバケットを使用します。

  3. バケットのバージョニングを有効にします。

    1. バケットを選択します。

    2. [プロパティ] を選択します。

    3. バケットバージョニングセクションで、編集 を選択します。

    4. 変更を有効にして保存します。

  4. アーティファクトをアップロードし、SHA-256 ハッシュを有効にします。

    1. バケットに移動します。

    2. アップロード を選択します。

    3. ファイルを追加 を選択し、ユーザースクリプトファイルを追加します。

    4. (オプション、存在する場合) .tar.gz ファイルを追加します。

    5. プロパティを展開します。

    6. チェックサムのチェックサム関数で、SHA256 を選択します。

    7. アップロード を選択します。

  5. これで、PySpark 分析テンプレートを作成する準備が整いました。

CLI
を使用してユーザースクリプトと仮想環境を S3 に保存するには AWS CLI:
  1. 次のコマンドを実行します。

    aws s3 cp --checksum-algorithm sha256 pyspark_venv.tar.gz s3://ARTIFACT-BUCKET/EXAMPLE-PREFIX/
  2. これで、PySpark 分析テンプレートを作成する準備が整いました。

注記

スクリプトまたは仮想環境を更新する必要がある場合:

  1. 新しいバージョンを別のオブジェクトとしてアップロードします。

  2. 新しいアーティファクトを使用して新しい分析テンプレートを作成します。

  3. 古いテンプレートを廃止します。

  4. 古いテンプレートがまだ必要な場合は、元のアーティファクトを S3 に保持します。