Amazon Nova とは何ですか?
注記
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 が新しいモデルと拡張機能で利用可能になりました。新機能とドキュメントの更新は、「Amazon Nova 2 ユーザーガイド」で公開されています。Amazon Nova 2 の最新情報については、「Amazon Nova 2 の最新情報」を参照してください。
Amazon Nova は、最先端のインテリジェンスと業界をリードするコストパフォーマンスを実現する基盤モデルです。組織は、安全で信頼性が高く、費用対効果の高い Amazon Nova を使用して、生成 AI アプリケーションを構築およびスケーリングできます。Amazon Nova は、テキスト、画像、動画、音声、API コール、エージェンティック AI など、モダリティやユースケースにおいて AI イノベーションを加速します。Amazon Nova で構築を開始するには、Amazon Bedrock を使用して API からモデルにアクセスする必要があります。
Amazon Nova モデルカテゴリ
Amazon Nova は、理解、クリエイティブ、音声機能において強力な基盤モデルを提供します。
モデル |
Category |
説明 |
ユースケース |
Regions |
|---|---|---|---|---|
Amazon Nova Premier |
キャッシュ |
複雑なタスクに最適なマルチモーダルモデルであり、費用対効果の高いアプリケーション用のカスタムモデルを蒸留するうえで最高の教師です。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。 |
インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化 |
米国東部 (バージニア北部)1、AWS GovCloud (米国西部) |
Amazon Nova Pro |
キャッシュ |
幅広いタスクの精度、速度、コストを最適に組み合わせた、高性能のマルチモーダルモデルです。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。 |
インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化 |
米国東部 (バージニア北部)1、アジアパシフィック (シドニー)1、欧州 (ロンドン)1、AWS GovCloud (米国西部) |
Amazon Nova Lite |
キャッシュ |
非常に低コストのマルチモーダルモデルで、画像、動画、テキストの入力を高速で処理できます。テキスト、画像、動画、ドキュメント、コードなど、さまざまな入力を理解します。 |
インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション、ビデオ分析、UI ワークフロー自動化 |
米国東部 (バージニア北部)1、アジアパシフィック (シドニー)1、欧州 (ロンドン)1、AWS GovCloud (米国西部) |
Amazon Nova Micro |
キャッシュ |
非常に低コストで最小レイテンシーのレスポンスを提供するテキストのみのモデルです。 |
インタラクティブチャットインターフェイス、検索拡張生成 (RAG) システム、エージェントアプリケーション |
米国東部 (バージニア北部)1、アジアパシフィック (シドニー)1、欧州 (ロンドン)1、AWS GovCloud (米国西部) |
Amazon Nova Canvas |
Creative |
カスタマイズおよび制御機能を備えた高品質の画像生成モデルです。テキストと画像の入力をプロフェッショナルグレードの画像に変換します。 |
メディア、エンターテインメント、小売、マーケティング、広告、カスタマイズ可能なビジュアルコンテンツ生成 |
米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) |
Amazon Nova Reel |
Creative |
クリエイティブコンテンツの生成を誰もが行えるように設計された動画生成モデルです。テキストと画像の入力をプロフェッショナルグレードの動画に変換します。 |
メディア、エンターテインメント、小売、マーケティング、広告、カスタマイズ可能なビジュアルコンテンツ生成 |
米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) |
Amazon Nova Sonic |
音声 |
英語 (米国、英国)、フランス語、イタリア語、ドイツ語、スペイン語の 5 つの言語で会話型音声の理解と生成を行うための基盤モデルです。音声を入力として受け入れ、テキスト文字を起こしながら音声を出力します。双方向ストリーミング API 機能を搭載し、リアルタイムかつ低レイテンシーの複数ターン会話を可能にします。 |
仮想アシスタント、カスタマーサービスソリューション、インタラクティブな音声エクスペリエンス、リアルタイムの音声インタラクション |
米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京) |
1 このモデルには、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ストックホルム)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (パリ)、アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ) でクロスリージョン推論を通じてアクセスできます。詳細については、「クロスリージョン推論によるレジリエンスの向上」を参照してください。
Amazon Bedrock でのモデルとリージョンの完全なサポート情報については、「Amazon Bedrock でサポートされている基盤モデル」を参照してください。
モデル仕様
次の表は、各 Amazon Nova モデルファミリーの詳細な仕様を示しています。
モデル仕様について
Amazon Nova Premier |
Amazon Nova Pro |
Amazon Nova Lite |
Amazon Nova Micro |
|
|---|---|---|---|---|
モデル ID |
amazon.nova-premier-v1:0 |
amazon.nova-pro-v1:0 |
amazon.nova-lite-v1:0 |
amazon.nova-micro-v1:0 |
推論プロファイル ID |
us.amazon.nova-premier-v1:0 |
us.amazon.nova-pro-v1:0 |
us.amazon.nova-lite-v1:0 |
us.amazon.nova-micro-v1:0 |
入力モダリティ |
テキスト、画像、動画 |
テキスト、画像、動画 |
テキスト、画像、動画 |
テキスト |
出力モダリティ |
テキスト |
テキスト |
テキスト |
テキスト |
コンテキストウィンドウ |
100 万回 |
300k |
300k |
128k |
最大出力トークン |
10K |
10k |
10k |
10k |
サポートされている言語 |
200+1 |
200+1 |
200+1 |
200+1 |
Regions |
米国東部 (バージニア北部)2 |
米国東部 (バージニア北部)2、アジアパシフィック (東京)2、アジアパシフィック (シドニー)2、欧州 (ロンドン)2、AWS GovCloud (米国西部) |
米国東部 (バージニア北部)2、アジアパシフィック (東京)2、アジアパシフィック (シドニー)2、欧州 (ロンドン)2、AWS GovCloud (米国西部) |
米国東部 (バージニア北部)2、アジアパシフィック (東京)2、アジアパシフィック (シドニー)2、欧州 (ロンドン)2、AWS GovCloud (米国西部) |
ドキュメントのサポート |
PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD |
PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD |
PDF、CSV、DOC、DOCX、XLS、XLSX、HTML、TXT、MD |
なし |
Converse API |
はい |
はい |
はい |
はい |
InvokeAPI |
はい |
はい |
はい |
はい |
ストリーミング |
はい |
はい |
はい |
はい |
バッチ推論 |
はい |
はい |
はい |
はい |
ファインチューニング |
なし |
はい |
はい |
はい |
プロビジョンドスループット |
なし |
はい |
はい |
はい |
Bedrock ナレッジベース |
はい |
はい |
はい |
はい |
Bedrock エージェント |
はい |
はい |
はい |
はい |
Bedrock ガードレール |
はい (テキストのみ) |
はい (テキストのみ) |
はい (テキストのみ) |
はい |
Bedrock の評価 |
はい (テキストのみ) |
はい (テキストのみ) |
はい (テキストのみ) |
はい |
Bedrock プロンプトフロー |
はい |
はい |
はい |
はい |
Bedrock Studio |
はい |
はい |
はい |
はい |
Bedrock モデル蒸留 |
Teacher to: Pro、Lite、Micro |
Teacher to: Lite、Micro Student of: Premier |
Student of: Premier、Pro |
Student of: Premier、Pro |
1 英語、ドイツ語、スペイン語、フランス語、イタリア語、日本語、韓国語、アラビア語、簡体字中国語、ロシア語、ヒンディー語、ポルトガル語、オランダ語、トルコ語、ヘブライ語の 15 言語で最適化されています。
2 このモデルには、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ストックホルム)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (パリ)、アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ) の各リージョンでクロスリージョン推論を通じてアクセスできます。クロスリージョン推論を使用すると、異なる AWS リージョン でのコンピューティングを活用することで、予期しないトラフィックバーストをシームレスに管理できます。クロスリージョン推論を使用すると、複数の AWS リージョン にトラフィックを分散できます。クロスリージョン推論の詳細については、「Amazon Bedrock ユーザーガイド」の「推論プロファイルでサポートされているリージョンとモデル」および「クロスリージョン推論による耐障害性の向上」を参照してください。
クリエイティブモデルと音声モデルの仕様
Amazon Nova Canvas |
Amazon Nova Reel |
Amazon Nova Sonic |
|
|---|---|---|---|
モデル ID |
amazon.nova-canvas-v1:0 |
amazon.nova-reel-v1:1 |
amazon.nova-sonic-v1:0 |
入力モダリティ |
テキスト、イメージ |
テキスト、イメージ |
音声 |
出力モダリティ |
Image |
動画 |
文字起こしとテキストレスポンスを伴う音声 |
プロンプトの最大長さ |
1024 文字 |
||
入力コンテキストウィンドウ |
512 文字 |
300k コンテキスト |
|
出力解像度 (生成タスク) |
419 万ピクセル (2048x2048、2816x1536) |
1280x720、24 フレーム/秒 |
|
最大出力解像度 (編集タスク) |
以下のすべての要件を満たす必要があります。
|
||
最大接続時間 |
接続タイムアウトは 8 分、お客様あたり最大 20 の同時接続。1 |
||
サポートされている入力タイプ |
PNG、JPEG |
PNG、JPEG |
|
サポートされている言語 |
英語 |
英語 |
英語 (米国、英国)、フランス語、イタリア語、ドイツ語、スペイン語2 |
Regions |
米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) |
米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) |
米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京) |
非同期呼び出しモデル API |
なし |
はい |
|
Invoke Model API |
はい |
なし |
|
双方向ストリーム API サポート |
はい |
||
Bedrock ナレッジベース |
ツールの使用 (関数呼び出し) でサポート |
1 デフォルトでは、接続制限は 8 分ですが、前の会話の履歴を指定することで、接続を更新して会話を続行できます。
2 サポートされている音声のリストについては、「Amazon Nova Sonic で使用可能な音声」を参照してください。