Amazon Nova とは何ですか? - Amazon Nova

Amazon Nova とは何ですか?

Amazon Nova は、Amazon Bedrock で利用できる、最先端のインテリジェンスと業界をリードするコストパフォーマンスを実現する新世代の基盤モデルです。Amazon Nova モデルには、4 つの理解モデル、2 つのクリエイティブコンテンツ生成モデル、1 つの Speech-to-Speech モデルが含まれます。Amazon Bedrock とのシームレスな統合により、開発者は Amazon Nova 基盤モデルを使用して生成 AI アプリケーションを構築およびスケーリングできます。Amazon Nova で構築を開始するには、Amazon Bedrock を使用して API からモデルにアクセスする必要があります。

理解モデル: Amazon Nova Premier、Amazon Nova Pro、Amazon Nova Lite、Amazon Nova Micro

Amazon Nova モデルは、それぞれのインテリジェンスクラスで最も速く、最も費用対効果の高いものの 1 つです。また、エージェント機能と UI の動作にも優れています。Amazon Bedrock のテキストとビジョンのファインチューニングを使用すると、Amazon Nova Pro、Lite、Micro をカスタマイズして、ニーズに最適なインテリジェンスとコストを提供できます。

  • Amazon Nova Micro は、非常に低コストで最小レイテンシーのレスポンスを提供するテキストのみのモデルです。

  • Amazon Nova Lite は、非常に低コストのマルチモーダルモデルで、イメージ、動画、テキストの入力を高速で処理できます。

  • Amazon Nova Pro は、幅広いタスクの精度、速度、コストを最適に組み合わせた、高性能のマルチモーダルモデルです。

  • Amazon Nova Premier は、複雑なタスクに最適なマルチモーダルモデルであり、費用対効果の高いアプリケーション用のカスタムモデルを蒸留するうえで最高の教師です。

クリエイティブコンテンツ生成モデル: Amazon Nova Canvas と Amazon Nova Reel

Amazon Nova Canvas と Amazon Nova Reel は、クリエイティブなニーズに合わせてビジュアル出力を柔軟に調整しながら、高品質のイメージと動画を提供します。

  • Amazon Nova Canvas は、テキスト入力とイメージ入力からプロフェッショナルグレードの画像を作成する画像生成モデルです。Amazon Nova Canvas は、広告、マーケティング、エンターテインメントなどの幅広いアプリケーションに最適です。

  • Amazon Nova Reel は、入力テキストとイメージからの短い動画の生成をサポートする動画生成モデルです。Amazon Nova Reel は、自然言語入力を使用したカメラモーションコントロールを提供します。

Amazon Nova Canvas は米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) で、Amazon Nova Reel は米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京) で利用できます。

Speech-to-Speech モデル: Amazon Nova Sonic

Amazon Nova Sonic は、会話音声の理解と生成の基礎モデルです。モデルは音声を入力として受け入れ、テキスト文字を起こしながら音声を出力します。Amazon Nova Sonic は、コンテキストに応じた豊かさを備えた人間のような自然な会話 AI エクスペリエンスを提供します。これは、双方向ストリーミング API 機能を搭載した最初のモデルであり、リアルタイムかつ低レイテンシーの複数ターン会話を可能にします。

Amazon Nova Sonic は、現在、米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京) において英語 (米国、英国) とスペイン語で利用可能です。

Amazon Bedrock でのモデルとリージョンの完全なサポート情報については、「Amazon Bedrock でサポートされている基盤モデル」を参照してください。

全体的なモデル情報

Amazon Nova Premier

Amazon Nova Pro

Amazon Nova Lite

Amazon Nova Micro

モデル ID

amazon.nova-premier-v1:0

amazon.nova-pro-v1:0

amazon.nova-lite-v1:0

amazon.nova-micro-v1:0

推論プロファイル ID

us.amazon.nova-premier-v1:0

us.amazon.nova-pro-v1:0

us.amazon.nova-lite-v1:0

us.amazon.nova-micro-v1:0

入力モダリティ

テキスト、画像、動画

テキスト、画像、動画

テキスト、画像、動画

テキスト

出力モダリティ

テキスト

テキスト

テキスト

テキスト

コンテキストウィンドウ

100 万回

300k

300k

128k

最大出力トークン

10K

10k

10k

10k

サポートされている言語

200+1

200+1

200+1

200+1

リージョン

米国東部 (バージニア北部)2

米国東部 (バージニア北部) 2、アジアパシフィック (東京) 2、AWSGovCloud (米国西部)

米国東部 (バージニア北部) 2、アジアパシフィック (東京) 2、AWSGovCloud (米国西部)

米国東部 (バージニア北部) 2、アジアパシフィック (東京) 2、AWSGovCloud (米国西部)

ドキュメントのサポート

pdf、csv、doc、docx、xls、xlsx、html、txt、md

pdf、csv、doc、docx、xls、xlsx、html、txt、md

pdf、csv、doc、docx、xls、xlsx、html、txt、md

いいえ

Converse API

はい

あり

あり

はい

InvokeAPI

はい

あり

あり

はい

ストリーミング

はい

あり

あり

はい

バッチ推論

はい

あり

あり

はい

ファインチューニング

いいえ

はい

あり

はい

プロビジョンドスループット

いいえ

はい

あり

はい

Bedrock ナレッジベース

はい

あり

あり

はい

Bedrock エージェント

はい

あり

あり

はい

Bedrock ガードレール

はい (テキストのみ)

はい (テキストのみ)

はい (テキストのみ)

はい

Bedrock の評価

はい (テキストのみ)

はい (テキストのみ)

はい (テキストのみ)

はい

Bedrock プロンプトフロー

はい

あり

あり

はい

Bedrock Studio

はい

あり

あり

はい

Bedrock モデル蒸留

Teacher to: Pro、Lite、Micro

Teacher to: Lite、Micro

Student of: Premier

Student of: Premier、Pro

Student of: Premier、Pro

1: 英語、ドイツ語、スペイン語、フランス語、イタリア語、日本語、韓国語、アラビア語、簡体字中国語、ロシア語、ヒンディー語、ポルトガル語、オランダ語、トルコ語、ヘブライ語の 15 言語で最適化されています。

2: このモデルは、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (ストックホルム)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (パリ)、アジアパシフィック (東京)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (ソウル)、アジアパシフィック (ムンバイ) の各リージョンでクロスリージョン推論を通じてアクセスできます。クロスリージョン推論を使用すると、異なる AWS リージョン でのコンピューティングを活用することで、予期しないトラフィックバーストをシームレスに管理できます。クロスリージョン推論を使用すると、複数の AWS リージョン にトラフィックを分散できます。クロスリージョン推論の詳細については、「Amazon Bedrock ユーザーガイド」の「推論プロファイルでサポートされているリージョンとモデル」および「クロスリージョン推論による耐障害性の向上」を参照してください。

Amazon Nova Canvas

Amazon Nova Reel

モデル ID

amazon.nova-canvas-v1:0

amazon.nova-reel-v1:1

入力モダリティ

テキスト、イメージ

テキスト、イメージ

出力モダリティ

イメージ

動画

プロンプトの最大長さ

1024 文字

入力コンテキストウィンドウ

512 文字

出力解像度 (生成タスク)

419 万ピクセル (2048x2048、2816x1536)

1280x720、24 フレーム/秒

最大出力解像度 (編集タスク)

以下のすべての要件を満たす必要があります。

  • 最長辺で 4096 ピクセル

  • 1:4 と 4:1 の間のアスペクト比

  • 合計ピクセル数が 419 万以下

サポートされている入力タイプ

PNG、JPEG

PNG、JPEG

サポートされている言語

英語

英語

リージョン

米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)

米国東部 (バージニア北部)、欧州 (アイルランド)、アジアパシフィック (東京)

非同期呼び出しモデル API

いいえ

はい

Invoke Model API

はい

いいえ

Amazon Nova Sonic

モデル ID

amazon.nova-sonic-v1:0

入力モダリティ

音声

出力モダリティ

文字起こしとテキストレスポンスを伴う音声

コンテキストウィンドウ

300k コンテキスト

最大接続時間

接続タイムアウトは 8 分、お客様あたり最大 20 の同時接続。1

サポートされている言語

英語 (米国、英国) とスペイン語

リージョン

米国東部 (バージニア北部)、欧州 (ストックホルム)、アジアパシフィック (東京)

双方向ストリーム API サポート

はい

Bedrock ナレッジベース

ツールの使用 (関数呼び出し) でサポート

1: デフォルトでは、接続制限は 8 分ですが、前の会話の履歴を指定することで、接続を更新して会話を続行できます。