Nova Customization SDK - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Nova Customization SDK

Nova Customization SDK は、Amazon Nova モデルをカスタマイズするための包括的な Python SDK です。SDK は、SageMaker AI や Amazon Bedrock など、さまざまなプラットフォームにわたる Amazon Nova モデルのトレーニング、評価、モニタリング、デプロイ、推論のための統合インターフェイスを提供します。モデルをドメイン固有のタスクに適応させる場合でも、ユースケースに合わせてパフォーマンスを最適化する場合でも、この SDK は 1 つの統合インターフェイスで必要なものをすべて提供します。

利点

  • データ準備からデプロイ、モニタリングまで、モデルカスタマイズライフサイクル全体で 1 つの SDK。

  • LoRA アプローチとフルランクアプローチの両方で、教師ありファインチューニング (SFT) や強化ファインチューニング (RFT) を含む複数のトレーニング方法をサポートします。

  • SageMaker AI トレーニングジョブと SageMaker HyperPod の自動リソース管理のサポートが組み込まれています。

  • トレーニング手法に適したレシピやコンテナ URI が見つからなくなりました。

  • 独自のトレーニングレシピを使用するか、パラメータオーバーライドで SDK のインテリジェントデフォルトを使用します。

  • SDK は、サポートされているモデルとインスタンスの組み合わせに対して設定を検証し、トレーニングを開始する前にエラーを防止します。

  • 統合された Amazon CloudWatch モニタリングにより、トレーニングの進行状況をリアルタイムで追跡できます。

要件

SDK には、少なくとも Python 3.12 が必要です。

インストール

この SDK をインストールするには、次のコマンドに従ってください。

pip install amzn-nova-customization-sdk

サポートされているモデルとテクニック

SDK は、Amazon Nova ファミリー内で以下のモデルと手法をサポートしています。

Method サポートされているモデル
教師ありファインチューニング LoRA すべての Nova モデル
教師ありファインチューニングフルランク すべての Nova モデル
LoRA の微調整の強化 Nova Lite 2.0
フルランクのファインチューニングの強化 Nova Lite 2.0

開始方法

1. データの準備

ローカルファイルまたは S3 からデータセットをロードし、選択したトレーニング方法に適した形式への変換を SDK で処理できるようにします。または、フォーマットされたデータを指定してすぐに開始します。

from amzn_nova_customization_sdk.dataset.dataset_loader import JSONLDatasetLoader from amzn_nova_customization_sdk.model.model_enums import Model, TrainingMethod loader = JSONLDatasetLoader(question="input", answer="output") loader.load("s3://your-bucket/training-data.jsonl") loader.transform(method=TrainingMethod.SFT_LORA, model=Model.NOVA_LITE)

2. インフラストラクチャを設定する

コンピューティングリソースを選択する — SDK は設定を検証し、最適なセットアップを保証します。

from amzn_nova_customization_sdk.manager.runtime_manager import SMTJRuntimeManager, SMHPRuntimeManager # SageMaker Training Jobs runtime = SMTJRuntimeManager( instance_type="ml.p5.48xlarge", instance_count=4 ) # SageMaker HyperPod runtime = SMHPRuntimeManager( instance_type="ml.p5.48xlarge", instance_count=4, cluster_name="my-hyperpod-cluster", namespace="kubeflow" )

3. トレーニング

わずか数行のコードでトレーニングを開始します。

from amzn_nova_customization_sdk.model import NovaModelCustomizer from amzn_nova_customization_sdk.model.model_enums import Model, TrainingMethod customizer = NovaModelCustomizer( model=Model.NOVA_LITE_2, method=TrainingMethod.SFT_LORA, infra=runtime, data_s3_path="s3://your-bucket/prepared-data.jsonl" ) result = customizer.train(job_name="my-training-job")

4. モニタリング

SDK から直接トレーニングの進行状況を追跡します。

from amzn_nova_customization_sdk.monitor.log_monitor import CloudWatchLogMonitor # Monitor training logs customizer.get_logs() # Or monitor directly via CloudWatchLogMonitor monitor = CloudWatchLogMonitor.from_job_result(result) monitor.show_logs(limit=10) # Check job status result.get_job_status() # InProgress, Completed, Failed

5. 評価

さまざまな組み込みベンチマークを使用してモデルのパフォーマンスを評価するか、独自の評価を設計します。

from amzn_nova_customization_sdk.recipe_config.eval_config import EvaluationTask # Evaluate on benchmark tasks eval_result = customizer.evaluate( job_name="model-eval", eval_task=EvaluationTask.MMLU, model_path=result.model_artifacts.checkpoint_s3_path )

6. デプロイ

Amazon Bedrock の組み込みサポートを使用して、カスタマイズされたモデルを本番環境にデプロイします。

from amzn_nova_customization_sdk.model.model_enums import DeployPlatform # Bedrock provisioned throughput deployment = customizer.deploy( model_artifact_path=result.model_artifacts.checkpoint_s3_path, deploy_platform=DeployPlatform.BEDROCK_PT, pt_units=10 ) # Bedrock On-Demand deployment = customizer.deploy( model_artifact_path=result.model_artifacts.checkpoint_s3_path, deploy_platform=DeployPlatform.BEDROCK_OD, pt_units=10 )

主な機能

オンザフライレシピの作成

SDK を使用すると、特定の手法に適したレシピやコンテナ URI を検索する必要がなくなります。

インテリジェントデータ処理

SDK は、データを自動的にトレーニング用の正しい形式に変換します。JSON、JSONL、CSV ファイルのいずれを使用している場合でも、データローダーは変換をシームレスに処理します。Data Loader は、テキストデータとマルチモーダルデータ (イメージとビデオ) をサポートしています。

エンタープライズインフラストラクチャのサポート

SDK は SageMaker トレーニングジョブと SageMaker HyperPod の両方で動作し、以下を自動的に管理します。

  • インスタンスタイプの検証

  • レシピの検証

  • ジョブのオーケストレーションとモニタリング

包括的な評価

カスタマイズされたモデルを、以下を含む標準ベンチマークと照らし合わせて評価します。

  • MMLU (Massive Multitask Language Understanding)

  • BBH (高度な推論タスク)

  • GPQA (卒業生レベルの Google 証明 Q&A)

ベンチマークのデフォルトを使用するか、ニーズに合わせて変更します。

  • BYOM (独自のメトリクスを使用)

  • BYOD (Bring Your Own Dataset)

本番デプロイ

以下のオプションを使用して、モデルを Amazon Bedrock にデプロイします。

  • プロビジョンドスループット - 一貫したパフォーマンスを実現する専用容量

  • オンデマンド Pay-per-use

バッチ推論

大規模な推論ジョブを効率的に実行します。

  • 数千のリクエストを並行して処理する

  • 自動結果集約

  • コスト効率の高いバッチ処理

詳細はこちら

Nova Customization SDK を使用して Nova モデルのカスタマイズを開始する準備はできましたか? 詳細なガイド、API リファレンス、その他の例については、GitHub リポジトリを参照してください。https://github.com/aws-samples/sample-nova-customization-sdk/