Amazon Nova とは何ですか？

注記

このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 が新しいモデルと拡張機能で利用可能になりました。新機能とドキュメントの更新は、「Amazon Nova 2 ユーザーガイド」で公開されています。Amazon Nova 2 の最新情報については、「Amazon Nova 2 の最新情報」を参照してください。

Amazon Nova は、最先端のインテリジェンスと業界をリードするコストパフォーマンスを実現する基盤モデルです。組織は、安全で信頼性が高く、費用対効果の高い Amazon Nova を使用して、生成 AI アプリケーションを構築およびスケーリングできます。Amazon Nova は、テキスト、画像、動画、音声、API コール、エージェンティック AI など、モダリティやユースケースにおいて AI イノベーションを加速します。Amazon Nova で構築を開始するには、Amazon Bedrock を使用して API からモデルにアクセスする必要があります。

Amazon Nova モデルカテゴリ

Amazon Nova は、理解、クリエイティブ、音声機能において強力な基盤モデルを提供します。

モデル	Category	説明	ユースケース	Regions
Amazon Nova Premier	キャッシュ	複雑なタスクに最適なマルチモーダルモデルであり、費用対効果の高いアプリケーション用のカスタムモデルを蒸留するうえで最高の教師です。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。	インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化	米国東部 (バージニア北部)¹、AWS GovCloud (米国西部)
Amazon Nova Pro	キャッシュ	幅広いタスクの精度、速度、コストを最適に組み合わせた、高性能のマルチモーダルモデルです。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。	インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化	米国東部 (バージニア北部)¹、アジアパシフィック (シドニー)¹、欧州 (ロンドン)¹、AWS GovCloud (米国西部)
Amazon Nova Lite	キャッシュ	非常に低コストのマルチモーダルモデルで、画像、動画、テキストの入力を高速で処理できます。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。	インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化	米国東部 (バージニア北部)¹、アジアパシフィック (シドニー)¹、欧州 (ロンドン)¹、AWS GovCloud (米国西部)
Amazon Nova Micro	キャッシュ	非常に低コストで最小レイテンシーのレスポンスを提供するテキストのみのモデルです。	インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション	米国東部 (バージニア北部)¹、アジアパシフィック (シドニー)¹、欧州 (ロンドン)¹、AWS GovCloud (米国西部)
Amazon Nova Canvas	Creative	カスタマイズおよび制御機能を備えた高品質の画像生成モデルです。テキストと画像の入力をプロフェッショナルグレードの画像に変換します。	メディア、エンターテインメント、小売、マーケティング、広告、カスタマイズ可能なビジュアルコンテンツ生成	米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)
Amazon Nova Reel	Creative	クリエイティブコンテンツの生成を誰もが行えるように設計された動画生成モデルです。テキストと画像の入力をプロフェッショナルグレードの動画に変換します。	メディア、エンターテインメント、小売、マーケティング、広告、カスタマイズ可能なビジュアルコンテンツ生成	米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)
Amazon Nova Sonic	音声	英語 (米国、英国)、フランス語、イタリア語、ドイツ語、スペイン語の 5 つの言語で会話型音声の理解と生成を行うための基盤モデルです。音声を入力として受け入れ、テキスト文字を起こしながら音声を出力します。双方向ストリーミング API 機能を搭載し、リアルタイムかつ低レイテンシーの複数ターン会話を可能にします。	仮想アシスタント、カスタマーサービスソリューション、インタラクティブな音声エクスペリエンス、リアルタイムの音声インタラクション	米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京)

¹ このモデルには、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ストックホルム)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (パリ)、アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ) でクロスリージョン推論を通じてアクセスできます。詳細については、「クロスリージョン推論によるレジリエンスの向上」を参照してください。

Amazon Bedrock でのモデルとリージョンの完全なサポート情報については、「Amazon Bedrock でサポートされている基盤モデル」を参照してください。

モデル仕様

次の表は、各 Amazon Nova モデルファミリーの詳細な仕様を示しています。

モデル仕様について

	Amazon Nova Premier	Amazon Nova Pro	Amazon Nova Lite	Amazon Nova Micro
モデル ID	amazon.nova-premier-v1:0	amazon.nova-pro-v1:0	amazon.nova-lite-v1:0	amazon.nova-micro-v1:0
推論プロファイル ID	us.amazon.nova-premier-v1:0	us.amazon.nova-pro-v1:0	us.amazon.nova-lite-v1:0	us.amazon.nova-micro-v1:0
入力モダリティ	テキスト、画像、動画	テキスト、画像、動画	テキスト、画像、動画	テキスト
出力モダリティ	テキスト	テキスト	テキスト	テキスト
コンテキストウィンドウ	100 万回	300k	300k	128k
最大出力トークン	10K	10k	10k	10k
サポートされている言語	200+¹	200+¹	200+¹	200+¹
Regions	米国東部 (バージニア北部)²	米国東部 (バージニア北部)²、アジアパシフィック (東京)²、アジアパシフィック (シドニー)²、欧州 (ロンドン)²、AWS GovCloud (米国西部)	米国東部 (バージニア北部)²、アジアパシフィック (東京)²、アジアパシフィック (シドニー)²、欧州 (ロンドン)²、AWS GovCloud (米国西部)	米国東部 (バージニア北部)²、アジアパシフィック (東京)²、アジアパシフィック (シドニー)²、欧州 (ロンドン)²、AWS GovCloud (米国西部)
ドキュメントのサポート	PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD	PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD	PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD	なし
Converse API	はい	はい	はい	はい
InvokeAPI	はい	はい	はい	はい
ストリーミング	はい	はい	はい	はい
バッチ推論	はい	はい	はい	はい
ファインチューニング	なし	はい	はい	はい
プロビジョンドスループット	なし	はい	はい	はい
Bedrock ナレッジベース	はい	はい	はい	はい
Bedrock エージェント	はい	はい	はい	はい
Bedrock ガードレール	はい (テキストのみ)	はい (テキストのみ)	はい (テキストのみ)	はい
Bedrock の評価	はい (テキストのみ)	はい (テキストのみ)	はい (テキストのみ)	はい
Bedrock プロンプトフロー	はい	はい	はい	はい
Bedrock Studio	はい	はい	はい	はい
Bedrock モデル蒸留	Teacher to: Pro、Lite、Micro	Teacher to: Lite、Micro Student of: Premier	Student of: Premier、Pro	Student of: Premier、Pro

¹ 英語、ドイツ語、スペイン語、フランス語、イタリア語、日本語、韓国語、アラビア語、簡体字中国語、ロシア語、ヒンディー語、ポルトガル語、オランダ語、トルコ語、ヘブライ語の 15 言語で最適化されています。

² このモデルには、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ストックホルム)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (パリ)、アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ) の各リージョンでクロスリージョン推論を通じてアクセスできます。クロスリージョン推論を使用すると、異なる AWS リージョンでのコンピューティングを活用することで、予期しないトラフィックバーストをシームレスに管理できます。クロスリージョン推論を使用すると、複数の AWS リージョンにトラフィックを分散できます。クロスリージョン推論の詳細については、「Amazon Bedrock ユーザーガイド」の「推論プロファイルでサポートされているリージョンとモデル」および「クロスリージョン推論による耐障害性の向上」を参照してください。

クリエイティブモデルと音声モデルの仕様

	Amazon Nova Canvas	Amazon Nova Reel	Amazon Nova Sonic
モデル ID	amazon.nova-canvas-v1:0	amazon.nova-reel-v1:1	amazon.nova-sonic-v1:0
入力モダリティ	テキスト、イメージ	テキスト、イメージ	音声
出力モダリティ	Image	動画	文字起こしとテキストレスポンスを伴う音声
プロンプトの最大長さ	1024 文字
入力コンテキストウィンドウ		512 文字	300k コンテキスト
出力解像度 (生成タスク)	419 万ピクセル (2048x2048、2816x1536)	1280x720、24 フレーム/秒
最大出力解像度 (編集タスク)	以下のすべての要件を満たす必要があります。最長辺で 4096 ピクセル 1:4 と 4:1 の間のアスペクト比合計ピクセル数が 419 万以下
最大接続時間			接続タイムアウトは 8 分、お客様あたり最大 20 の同時接続。¹
サポートされている入力タイプ	PNG、JPEG	PNG、JPEG
サポートされている言語	英語	英語	英語 (米国、英国)、フランス語、イタリア語、ドイツ語、スペイン語²
Regions	米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)	米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)	米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京)
非同期呼び出しモデル API	なし	はい
Invoke Model API	はい	なし
双方向ストリーム API サポート			はい
Bedrock ナレッジベース			ツールの使用 (関数呼び出し) でサポート

¹ デフォルトでは、接続制限は 8 分ですが、前の会話の履歴を指定することで、接続を更新して会話を続行できます。

² サポートされている音声のリストについては、「Amazon Nova Sonic で使用可能な音声」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

開始方法