Amazon Nova 2 とは何ですか?
Amazon Nova は、テキスト、画像、動画、ドキュメント、音声を処理するマルチモーダル基盤モデルを提供します。Amazon Nova 2 モデルは、最大 100 万トークンのコンテキストと高度な推論機能をサポートしているため、複雑な入力を理解し、正確なレスポンスを生成する高度な AI アプリケーションを構築できます。
インタラクティブなチャットボットを構築し、ドキュメントや動画を分析し、推論の拡張で AI エージェントを作成し、音声対応アプリケーションを開発することができます。
主要なコンセプト
Amazon Nova モデルについて学ぶ前に、以下の主要な概念を把握しましょう。
- 基盤モデル
-
API を介してアクセスするさまざまなサイズと機能で使用できる事前トレーニング済みの AI システム。
- 推測
-
モデルにリクエストを送信し、生成されたレスポンスを受信するプロセス。
- 推論
-
モデルが複雑な問題を分解し、回答を提供する前に順を追って分析を表示できるようにする拡張思考機能。
- マルチモーダル
-
テキスト、画像、動画、ドキュメントなど、複数の入力タイプを 1 回のリクエストで処理して理解する機能。
- RAG (検索拡張生成)
-
モデルレスポンスを独自のデータソースと組み合わせて、より正確でコンテキストに応じた回答を提供する手法。
Amazon Nova モデル
Amazon Nova 2 には以下のモデルが含まれており、それぞれ異なるユースケース向けに最適化されています。
モデル |
入力モダリティ |
出力モダリティ |
ユースケース |
|---|---|---|---|
Nova 2 Lite |
テキスト、画像、動画、ドキュメント |
テキスト |
速度とコスト効率を優先する高処理量アプリケーション |
Nova 2 Sonic |
音声、テキスト |
音声、テキスト |
レスポンス時間が短い音声対応アプリケーション |
Nova Multimodal Embeddings |
テキスト、画像、ドキュメント、動画、オーディオ |
埋め込み |
セマンティック検索、レコメンデーションシステム、類似度マッチング |
すべてのモデルは最大 100 万個のコンテキストトークンをサポートし、1 回のレスポンスで最大 65,536 個のトークンを生成できます。推論機能を持つモデルは、複雑な問題を段階的に解決するために、拡張思考を実行できます。
何が構築できますか?
Amazon Nova で構築できるものの例を次に示します。
-
インテリジェントドキュメントアシスタント – (RAG を使用して) 最大 100 万のコンテキストトークンを含む大規模なドキュメントを処理し、質問に答え、インサイトを抽出します
-
複雑な推論アプリケーション – モデルの段階的分析を示す拡張思考で (または推論で) 複数ステップの問題を解決します
-
動画分析パイプライン – 大規模にインサイトを抽出し、概要を生成して、動画コンテンツの主要な瞬間を特定します (Nova 2 Lite)
-
音声対応 AI エージェント – 音声入力を理解し、自然言語で応答する会話エージェントを構築します (Nova 2 Sonic)
利点
Amazon Nova は、以下のような利点を提供します。
- マルチモーダル理解
-
テキスト、画像、動画、ドキュメント、音声を 1 回のリクエストで処理します。Amazon Nova モデルは、さまざまな入力タイプの関係を理解します。
- 拡張コンテキスト
-
最大 100 万トークンのサポートにより、コンテキストを失うことなく、コードベース全体、長いドキュメント、または長い会話を処理できます。
- 高度な推論
-
推論機能を持つモデルは、複雑な問題を分解し、段階的分析を示し、複数ステップのタスクの精度を向上させます。
- 柔軟なデプロイ
-
Amazon Bedrock を通じて、管理対象のインフラストラクチャなしでモデルにアクセスしたり、ファインチューニングと強化学習を通じてモデルをカスタマイズしたりできます。
- 組み込みツール
-
外部統合なしで、ウェブグラウンディングを使用してリアルタイム情報にアクセスし、コードインタープリタを使用して Python コードを実行できます。
Amazon Nova の仕組み
Amazon Nova モデルは、Amazon Bedrock を通じてアクセスする基盤モデルです。基本的なワークフローは次のとおりです。
-
アプリケーションは、入力パラメータと設定パラメータを使用して Amazon Bedrock にリクエストを送信します。
-
Amazon Nova モデルは入力を処理し、設定されている場合は推論を適用します。
-
モデルはレスポンスを生成し、アプリケーションに返します。
RAG を使用してデータを組み込むか、組み込みツールを有効にするか、ファインチューニングによってモデルをカスタマイズすることで、レスポンスを強化できます。
料金
Amazon Nova の料金は、処理された入力トークンと出力トークンに基づいています。モデルによって料金階層は異なります。
-
Nova 2 Lite – 費用対効果の高い大量の処理に最適化されています
-
Nova 2 Sonic – 音声対応アプリケーション向けのバランスが取れた料金
現在の料金については、Amazon Bedrock の料金
次のステップ
-
Amazon Nova 2 の新機能については、「Amazon Nova 2 の新機能」を参照してください。
-
Amazon Nova の使用を開始するには、「Amazon Nova 2 の開始方法」を参照してください。
-
コア推論機能の詳細については、「コア推論」を参照してください。
-
ユースケースに合わせてモデルをカスタマイズするには、「SageMaker AI で Amazon Nova モデルをカスタマイズする」を参照してください。