翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Chime SDK の機械学習ベースの分析を目的としたワークフローについて
このセクションでは、Amazon Chime SDK 通話分析が備える機械学習分析機能の使用方法について説明します。
注記
同じ Kinesis Video Streams で複数の機械学習分析を実行する際には、ビデオストリームの GetMedia
および GetMediaForFragmentList
の接続レベル制限を引き上げなければならない場合があります。詳細については、「Kinesis Video Streams Developer Guide」の「Kinesis Video Streams limits」を参照してください。
このワークフローの用途:
-
コンソールを主に使用してセットアップを行う。
-
Voice Connector を既に使用し SIP メディアを通話分析に取り込んでいる、または使用する予定がある。Voice Connector は SIP と SIPREC の両方に対応しています。Voice Connector の設定については、「Managing Amazon Chime SDK Voice Connector」で詳しく確認できます。
-
すべての Voice Connector の通話に同じメディアインサイト設定を適用する。
-
Amazon Chime SDK 音声分析を使用する必要があり、Voice Connector またはメディアインサイトパイプラインが、その要件に設定されている。
Amazon Chime SDK コンソールでこのワークフローを有効にするには、「Configuring Voice Connectors to use call analytics」に記載の録音設定手順に従ってください。
このワークフローをプログラミングによって有効にするには、次の API を使用します。CreateMediaInsightsPipelineConfiguration API を使用して通話分析を設定し、PutVoiceConnectorStreamingConfiguration API を使用してその設定を Voice Connector に関連付けます。詳細については、「Amazon Chime SDK Administrator Guide」の「Configuring Voice Connectors to use voice analytics」を参照してください。
次の図は、Voice Connector によって通話分析セッションを開始するときのデータフローを示しています。図の数字は、次の各説明の番号に対応しています。
図中の手順を説明します。
-
Amazon Chime SDK コンソールまたは CreateMediaInsightsPipelineConfiguration API を使用して、メディアインサイトパイプラインを設定します。
-
Amazon Chime SDK コンソールまたは PutVoiceConnectorStreamingConfiguration API を使用して、設定を Voice Connector に関連付けます。詳細については、「Amazon Chime SDK Administrator Guide」の「 Configuring Voice Connectors to use call analytics」を参照してください。
-
発信中には、Voice Connector によって、各通話参加者の音声を受信します。
-
Voice Connector サービスは通話分析と既に統合されているため、通話分析設定をこのサービスにアタッチすると、メディアパイプラインサービスを使用した通話分析セッションが開始されます。
-
メディアパイプラインサービスによって、1 つ以上のメディアプロセッサが設定の指定どおりに呼び出されます。
-
メディアパイプラインサービスによって、出力データが 1 つ以上の宛先に設定どおりに送信されます。例えば、Amazon Kinesis Data Streams を介してリアルタイム分析を送信できます。設定によっては、通話のメタデータおよび分析を Amazon S3 データウェアハウスに送信することも可能です。
-
メディアパイプラインサービスによって、パイプラインステータスイベントがデフォルトの Amazon EventBridge に送信されます。ルールを設定している場合、そのルールに関する通知が Amazon EventBridge にも送信されます。詳細については、「Event Bridge 通知の使用」を参照してください。
注記
-
音声分析プロセッサを自動的に起動できるのは、StartSpeakerSearchTask API または StartVoiceToneAnalyisTask API を呼び出す場合のみです。
-
Voice Connector で通話分析を使用するには、Voice Connector ストリーミングを有効にする必要があります。この機能によって、アカウント内の Voice Connector で管理する Kinesis Video Streams に通話データをストリーミングできるようになるからです。詳細については、「Amazon Chime SDK Administrator Guide」の「Streaming Amazon Chime SDK Voice Connector media to Kinesis Video Streams」を参照してください。
また、Voice Connector の通話データは、数時間から数年まで、さまざまな期間、Kinesis Video Streams に保存できます。データ保持を行わない場合、通話データをすぐに使用しなければならなくなります。Kinesis Video Streams のコストは、使用する帯域幅と合計ストレージに基づいて判断します。データ保持期間は、Voice Connector のストリーミング設定を編集することで、いつでも調整できます。通話分析の記録を有効にするには、通話分析の終了時まで Kinesis Video Streams にデータが保持されるようにする必要があります。これを行うには、適切なデータ保持期間を指定します。
メディアインサイトパイプライン設定は、必要な数の Voice Connector に関連付けることができます。Voice Connector ごとに異なる設定を行うことも可能です。Voice Connector では、AWSServiceRoleForAmazonChimeVoiceConnector を使用して、トランザクション ID ごとに一度 CreateMediaInsightsPipeline API を自動的に呼び出します。詳細については、「Amazon Chime SDK Administrator Guide」の「Using the Amazon Chime SDK service-linked role for Amazon Chime SDK Voice Connectors」を参照してください。
Voice Connector を導入済みで、通話分析設定を適用するタイミングや、適用先の通話を制御する必要がある場合は、このワークフローを使用すると良いでしょう。
この方法を取るには、Voice Connector によって発行するイベント用に EventBridge のターゲットを作成し、それらのイベントを使用して通話分析パイプライン API をトリガーする必要があります。詳細については、「Amazon Chime SDK Administrator Guide」の「Automating the Amazon Chime SDK with EventBridge」を参照してください。
次の図は、Voice Connector で通話分析を使用する際に、より詳細に制御する方法を示しています。図の数字は、次の各説明の番号に対応しています。

図中の手順を説明します。
-
Amazon Chime SDK コンソールまたは CreateMediaInsightsPipelineConfiguration API を使用して、メディアインサイトパイプラインを設定します。
-
発信中には、Voice Connector によって、参加者の音声を受信します。
-
Voice Connector によって、通話音声が Kinesis Video Streams に送信され、対応するイベントが EventBridge に送信されます。これらのイベントには、ストリームおよび通話のメタデータが含まれています。
-
アプリケーションは、EventBridge のターゲットを介して EventBridge にサブスクライブされます。
-
アプリケーションによって、Amazon Chime SDK の CreateMediaInsightsPipeline API が呼び出されます。
-
メディアパイプラインサービスによって、1 つ以上のメディアプロセッサが呼び出されます。呼び出しは、メディアインサイトパイプライン設定内のプロセッサ要素に基づいて行われます。
-
メディアパイプラインサービスによって、出力データが 1 つ以上の宛先に設定どおりに送信されます。Amazon Chime SDK 通話分析によって、Amazon Kinesis Data Streams 経由でのリアルタイム分析が可能になり、設定済みの場合、通話のメタデータ分析を Amazon S3 データウェアハウスに送信できます。
-
メディアパイプラインサービスによって、そのイベントが Amazon EventBridge に送信されます。ルールを設定している場合、そのルールに関する通知が Amazon EventBridge にも送信されます。
-
UpdateMediaInsightsPipelineStatus API を呼び出すことで、通話分析セッションを一時停止または再開できます。
注記
通話録音は、通話の一時停止と再開に対応していません。また、通話中に開始した音声分析タスクも、セッションを一時停止すると停止します。再起動するには、StartSpeakerSearchTask または StartVoiceToneAnalyisTask API を呼び出す必要があります。
-
設定時にボイストーン分析を選択した場合は、StartSpeakerSearchTask API または StartVoiceToneAnalyisTask API を呼び出して音声分析を開始します。
このオプションを使用するには、音声データを Kinesis Video Streams (KVS) に発行し、KVS ストリームチャネル情報を使用して CreateMediaInsightsPipeline API を呼び出す必要があります。
注記
通話分析 API は最大 2 つの音声チャネルに対応しています。
CreateMediaInsightsPipeline API を呼び出すときに、KVS ストリームチャネルの定義ごとにフラグメント番号を指定できます。フラグメント番号を指定すると、そのフラグメントからストリームの処理が開始されます。フラグメント ID を指定しない場合、利用可能な最新のフラグメントからストリームの処理が開始されます。
通話分析は、音声サンプルレートが 8 kHz~48 kHz の PCM 音声 (符号付き 16 ビットリトルエンディアン音声形式のみ。WAV には未対応) に対応しています。電話音声などの低品質音声では一般的に約 8000 Hz のレートが使用され、高品質の音声では通常 16,000 Hz~48,000 Hz の範囲のレートが使用されます。指定するサンプルレートは、音声のサンプルレートと一致させる必要があります。詳細については、「Amazon Chime SDK API リファレンス」の「KinesisVideoStreamSourceRuntimeConfiguration」を参照してください。
Kinesis Video Streams プロデューサー SDK には、音声データを Kinesis Video Streams にストリーミングするために使用できるライブラリセットが用意されています。詳細については、「Amazon Kinesis Video Streams Developer Guide」の「Kinesis Video Streams Producer Libraries」を参照してください。
次の図は、カスタム Kinesis Video Streams プロデューサーで通話分析を使用する場合のデータフローを示しています。図の数字は、次の各説明の番号に対応しています。

-
AWS コンソールまたは CreateMediaInsightsPipelineConfiguration API を使用して、メディアインサイトパイプライン設定を作成します。
-
Kinesis Video Streams プロデューサーを使用して Kinesis Video Streams に音声を書き込みます。
-
アプリケーションで CreateMediaInsightsPipeline API が呼び出されます。
-
メディアパイプラインサービスによって、顧客の Kinesis Video Streams から音声が読み取られます。
-
メディアパイプラインサービスによって、そのイベントが Amazon EventBridge に送信されます。ルールを設定している場合、そのルールに関する通知が Amazon EventBridge にも送信されます。
-
メディアパイプラインサービスによって、1 つ以上のプロセッサ要素が呼び出されます。
-
メディアパイプラインサービスによって、出力データが 1 つ以上のシンク要素に送信されます。
-
UpdateMediaInsightsPipelineStatus API を呼び出すことで、通話分析セッションを一時停止または再開できます。
注記
通話録音は、一時停止と再開に対応していません。
-
アプリケーションで Amazon EventBridge イベントを処理して、カスタムビジネスワークフローをトリガーできます。
-
設定時に音声分析を選択した場合は、StartSpeakerSearchTask API または StartVoiceToneAnalyisTask API を呼び出して、アプリケーションで音声分析を開始できます。