Amazon Nova で画像の生成 - Amazon Nova

Amazon Nova で画像の生成

Amazon Nova Canvas モデルを使用すると、テキストプロンプトを使用してリアルでスタジオ品質の画像を生成できます。Amazon Nova Canvas はテキストから画像への変換や画像編集アプリケーションに使用できます。

Amazon Nova Canvas は次の機能をサポートしています。

  • テキストから画像 (T2I) 生成 – テキストプロンプトを入力し、出力として新しい画像を生成します。生成された画像には、テキストプロンプトで説明されている概念が取り込まれています。

  • 画像編集オプション – 含まれるもの: インペインティング、アウトペインティング、バリエーションの生成、画像マスクなしの自動編集。

  • インペインティング – 画像とセグメンテーションマスクを入力 (ユーザーからの入力またはモデルによって推定された入力) として使用し、マスク内の領域を再構成します。インペインティングを使用して、マスクされている要素を削除し、背景ピクセルに置き換えることができます。

  • アウトペインティング – 画像とセグメンテーションマスクを入力 (ユーザーからの入力またはモデルによって推定された入力) として使用し、領域をシームレスに拡張する新しいピクセルを生成します。正確なアウトペインティングを使用すると、画像を境界まで拡張するときにマスクされた画像のピクセルが維持されます。デフォルトのアウトペイントを使用すると、セグメンテーション設定に基づいてマスクされた画像のピクセルが画像の境界まで拡張されます。

  • 画像バリエーション – 1~5 個の画像とオプションのプロンプトを入力として使用します。入力画像の内容を保存しながら、スタイルや背景を変更する新しい画像を生成します。

  • 画像の条件付け – 入力リファレンス画像を使用して画像生成を導きます。モデルは、テキストプロンプトに従いながら、参照画像のレイアウトと構図と一致する出力画像を生成します。

  • 被写体の一貫性 – 被写体の一貫性により、ユーザーはリファレンス画像を使用してモデルをファインチューニングし、生成された画像で選択した被写体 (ペット、靴、ハンドバッグなど) を保持することができます。

  • カラーガイド付きコンテンツ – プロンプトとともに 16 進数カラーコードのリストを指定することができます。1~10 の 16 進数カラーコードを指定できます。返される画像には、ユーザーが指定したカラーパレットが組み込まれます。

  • 背景の削除 – 入力画像内の複数オブジェクトを自動的に識別し、背景を削除します。出力画像の背景は透明です。

  • コンテンツの出典 – 「Content Credentials Verify」などのサイトを使用して、画像が Amazon Nova Canvas によって生成されたかどうか確認します。これは、メタデータが削除されていない限り、画像が生成されたことを示します。

Amazon Nova Canvas

モデルの特徴

モデル ID

amazon.nova-canvas-v1:0

入力モダリティ

テキスト、イメージ

出力モダリティ

イメージ

プロンプトの最大長さ

1024 文字

最大出力の解像度 (生成タスク)

419 万ピクセル (2048x2048、2816x1536)

最大出力解像度 (編集タスク)

以下のすべての要件を満たす必要があります。

  • 最長辺で 4096 ピクセル

  • 1:4 と 4:1 の間のアスペクト比

  • 合計ピクセル数が 419 万以下

入力画像タイプのサポート

PNG、JPEG

サポートされている言語

英語

リージョン

米国東部 (バージニア北部)

Bedrock 機能のサポート

Invoke Model API

はい

ファインチューニング

はい

プロビジョンドスループット

いいえ