View a markdown version of this page

Amazon Nova 2 の新機能 - Amazon Nova

Amazon Nova 2 の新機能

Amazon Nova 2 では、理解、創造、音声機能が大幅に強化されています。以下のセクションでは、主な新機能と改善点について説明します。

新しいモデル

Nova 2 Lite

高度な推論を提供する拡張モデルで、拡張思考をサポートし、3 段階の強度コントロールを行い、本番規模のエージェントワークフローに最適化されたマルチモーダル理解が可能です。

Nova 2 Sonic

音声理解、自然言語処理、7 つの言語にわたる音声生成機能が改善された、アップグレードされた会話型音声モデル。

Nova Multimodal Embeddings

テキスト、画像、ドキュメント、動画、音声の入力を処理し、埋め込みを生成するマルチモーダル埋め込みモデル。

新しい特徴と機能

Nova Multimodal Embeddings

Nova Multimodal Embeddings は、テキスト、ドキュメント、画像、動画、オーディオを 1 つのモデルでサポートし、クロスモーダル検索アプリケーションを可能にします。Nova Multimodal Embeddings は、これらの各コンテンツタイプを統一されたセマンティックスペースにマッピングし、単一モーダル、クロスモーダル、マルチモーダルベクトルオペレーションを実行し、エージェント検索拡張生成 (RAG) やマルチモーダルセマンティック検索などのアプリケーションを駆動します。

思考と推論を拡張する

Nova 2 Lite は拡張思考をサポートしているため、モデルはレスポンスを生成する前に複雑な問題で推論により多くの時間を費やすことができます。この機能は、複数のツールを使用したエージェントワークフロー、高度な数学、複雑な計画、コード生成など、複数ステップの推論タスクの精度を向上させます。

詳細については、「Amazon Nova 2 の拡張思考」を参照してください。

組み込みツール

Amazon Nova 2 には、外部統合を必要とせずにモデル機能を拡張する組み込みツールが含まれています。

  • ウェブグラウンディング – ウェブからリアルタイムの情報にアクセスして、最新レスポンスを提供し、ハルシネーションを減らします。

  • コードインタープリタ – Python コードを実行して計算を行います。

AI エージェントの構築

Amazon Nova 2 モデルは、AI エージェントを構築するために最適化されています。このモデルにより、ツールの使用が改善され、複数ステップタスクの推論が向上し、複雑なエージェントワークフロー全体でコンテキストを維持する機能が強化されます。

ドキュメントの理解の向上

Nova 2 Lite には、複雑なドキュメントレイアウト、テーブル、グラフ、複数ページのドキュメントをよりよく理解できる、拡張されたドキュメント処理機能が備わっています。このモデルは、PDF、スプレッドシート、その他のドキュメント形式からより正確に情報を抽出できます。

動画の理解の強化

Nova 2 Lite では、視覚認識の向上、時間把握、アクション認識、長い動画シーケンスをより正確に処理する機能など、動画分析機能が改善されています。

モデルのカスタマイズ

Nova 2 Lite は、Amazon Bedrock および SageMaker AI で教師ありファインチューニング (SFT) と強化ファインチューニング (RFT) をサポートしているため、Amazon Nova 2 を特定のビジネスニーズに適応させることができます。

Amazon Nova Forge

Amazon Nova Forge は、Amazon Nova を使用して独自のフロンティアモデルを構築する最も簡単で費用対効果の高い方法を組織に提供する、その類では初のサービスです。

次のステップ