Luma AI モデル - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Luma AI モデル

このセクションでは、Luma AI モデルのリクエストパラメータとレスポンスフィールドについて説明します。この情報を使用して、StartAsyncInvoke オペレーションで Luma AI モデルを推論呼び出します。このセクションでは、Luma AI モデルを呼び出す方法を示す Python コード例も含まれています。推論オペレーションでモデルを使用するには、そのモデルのモデル ID が必要です。

  • モデル ID: luma.ray-v2:0

  • モデル名: Luma Ray 2

  • テキストからビデオへのモデル

Luma AI モデルは、StartAsyncInvoke、ListAsyncInvokes などの非同期 APIs を使用してモデルプロンプトを非同期的に処理します。 GetAsyncInvoke ListAsyncInvokes

Luma AI モデルは、次のステップを使用してプロンプトを処理します。

  • ユーザーは StartAsyncInvoke を使用してモデルにプロンプトを表示します。

  • InvokeJob が終了するまで待ちます。GetAsyncInvoke または を使用してListAsyncInvokes、ジョブの完了ステータスを確認できます。

  • モデル出力は、指定された出力 Amazon S3 バケットに配置されます。

API で Luma AI モデルを使用する方法の詳細については、 APIs「ビデオ生成」を参照してください。

Luma AI 推論呼び出し。

POST /async-invoke HTTP/1.1 Content-type: application/json { "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "your input text here", "aspect_ratio": "16:9", "loop": false, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

[フィールド]

  • prompt – (文字列) 出力ビデオに必要なコンテンツ (1 <= 長さ <= 5000 文字)。

  • aspect_ratio – (列挙) 出力ビデオのアスペクト比 (「1:1」、「16:9」、「9:16」、「4:3」、「3:4」、「21:9」、「9:21」)。

  • loop – (ブール値) 出力ビデオをループするかどうか。

  • duration – (列挙型) - 出力ビデオの再生時間 (「5s」、「9s」)。

  • resolution – (列挙型) 出力ビデオの解像度 (「540p」、「720p」)。

MP4 ファイルは、レスポンスで設定されたとおりに Amazon S3 バケットに保存されます。

Text-to-Video生成

Luma Ray 2 モデルを使用してテキストプロンプトからビデオを生成します。このモデルは、アスペクト比、期間、解像度、ループなど、さまざまなカスタマイズオプションをサポートしています。

基本的なText-to-Videoリクエスト

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

オプションを使用した高度なText-to-Video

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit", "aspect_ratio": "16:9", "loop": true, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

追加のText-to-Video例

解像度と期間パラメータの例。

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "a car", "resolution": "720p", "duration": "5s" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video生成

キーフレームを提供することで、静的イメージを動的ビデオに変換します。開始フレーム、終了フレーム、またはその両方を指定して、ビデオ生成プロセスを制御できます。

スタートフレームを使用した基本的な Image-to-Video

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

開始フレームと終了フレームを使用した Image-to-Video

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } }, "frame1": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } }, "loop": false, "aspect_ratio": "16:9" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video の追加パラメータ

  • keyframes – (オブジェクト) 開始 (frame0) および/または終了 (frame1) キーフレームを定義する

    • frame0 – キーフレームイメージの開始

    • frame1 – 終了キーフレームイメージ

    • type – 「イメージ」である必要があります

    • source – イメージソース

トラブルシューティング

Luma AI モデルを使用する際の一般的な問題と解決策:

  • ジョブステータス「失敗」 - S3 バケットに適切な書き込みアクセス許可があり、バケットが Bedrock サービスと同じリージョンに存在することを確認します。

  • イメージ URL アクセスエラー - イメージ URLsがパブリックにアクセスして HTTPS を使用していることを確認します。イメージはサポートされている形式 (JPEG、PNG) である必要があります。

  • 無効なパラメータエラー - アスペクト比値がサポートされているオプション (「1:1」、「16:9」、「9:16」、「4:3」、「3:4」、「21:9」、「9:21」) と一致し、期間が「5s」または「9s」のいずれかであることを確認します。

  • タイムアウトの問題 - 同期的に待機するのではなく、ジョブのステータスをチェックGetAsyncInvokeするために使用します。動画の生成には数分かかる場合があります。

  • プロンプトの長さエラー - プロンプトは 1~5000 文字にしておきます。長いプロンプトは拒否されます。

パフォーマンスノート

Luma AI モデルのパフォーマンスと制限に関する重要な考慮事項:

  • 処理時間 - ビデオの生成には通常、複雑さに応じて 5 秒のビデオで 2~5 分、9 秒のビデオで 4~8 分かかります。

  • 画像要件 - 入力画像は 512 x 512 ピクセルの最小解像度で高品質である必要があります。サポートされているイメージの最大サイズは 4096 x 4096 ピクセルです。

  • 出力ビデオサイズ - 生成されたビデオの範囲は、再生時間、解像度、コンテンツの複雑さに応じて 5~50 MB です。

  • レート制限 - 非同期 API コールはサービスクォータの対象となります。必要に応じて使用量を監視し、クォータの引き上げをリクエストします。

  • S3 ストレージ - 出力ビデオに十分な S3 ストレージ容量を確保し、コスト最適化のためのライフサイクルポリシーを検討します。

関連するドキュメント

追加情報および関連サービスについては、以下を参照してください。