TwelveLabs 模型 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

TwelveLabs 模型

本部分介绍 TwelveLabs 模型的请求参数和响应字段。使用此信息对TwelveLabs模型进行推理调用。TwelveLabs Pegasus 1.2模型支持InvokeModelInvokeModelWithResponseStream(流式传输)操作,而TwelveLabs Marengo Embed 2.7模型支持StartAsyncInvoke操作。本节还包括演示如何调用TwelveLabs模型的代码示例。要在推理操作中使用模型,您需要相关模型的模型 ID。要获取模型 ID,请参阅 Amazon Bedrock 中支持的根基模型

TwelveLabs是一家领先的多模态人工智能模型提供商,专门从事视频理解和分析。他们的高级模型通过 state-of-the-art计算机视觉和自然语言处理技术实现复杂的视频搜索、分析和内容生成功能。Amazon Bedrock 现在提供两种TwelveLabs模型:TwelveLabs Pegasus 1.2,它提供全面的视频理解和分析,以及为视频TwelveLabs Marengo Embed 2.7、文本、音频和图像内容生成高质量的嵌入内容。这些模型使开发人员能够构建能够智能地大规模处理、分析视频数据并从中获取见解的应用程序。

TwelveLabs Pegasus 1.2

一种多模态模型,可提供全面的视频理解和分析功能,包括内容识别、场景检测和情境理解。该模型可以分析视频内容并生成有关视频的文字描述、见解和问题的答案。

TwelveLabs Marengo Embed 2.7

一种多模态嵌入模型,可生成视频、文本、音频和图像内容的高质量矢量表示形式,用于相似度搜索、聚类和其他机器学习任务。该模型支持多种输入模式,并提供针对不同用例进行了优化的专用嵌入式。

下表列出了 Amazon Bedrock 中可用的TwelveLabs型号。

TwelveLabs 模型
模型名称 模型 ID 输入模式 输出模式 描述
TwelveLabs Pegasus 1.2 twelvelabs.pegasus-1-2-v 1:0 视频 文本 一种多模态模型,可提供全面的视频理解和分析功能,包括内容识别、场景检测和情境理解。
TwelveLabs Marengo Embed 2.7 twelvelabs.marengo-embed-2-7-v 1:0 视频、文本、音频、图片 嵌入 一种多模态嵌入模型,可生成视频、文本、音频和图像内容的高质量矢量表示形式,用于相似度搜索、聚类和其他机器学习任务。