本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
管理库实体
本节介绍如何管理数据自动化库中的实体。实体是特定于域的资源,可提高内容处理工作负载的提取准确性。当前,“自定义词汇” 是唯一支持的实体类型,它改进了音频和视频内容的语音识别和转录。
您可以使用 AWS 管理控制台或 AWS CLI 执行实体级操作。这些操作包括使用通过 S3 清单文件或内联负载提供的词汇表输入通过摄取任务添加新实体、监控此类摄取任务的状态、使用 UPSERT 操作更新现有实体、删除特定实体以及查看实体详细信息。与管理容器本身的库级操作不同,实体操作侧重于库中的内容。
可以使用以下方法管理库实体 APIs:
InvokeDataAutomationLibraryIngestionJob使用 UPSERT 或 DELETE 操作通过异步摄取任务添加、更新或删除实体;
GetDataAutomationLibraryIngestionJob检查摄取任务的状态和进度;
ListDataAutomationLibraryIngestionJobs检索账户中所有摄取任务的分页列表;
ListDataAutomationLibraryEntities检索库中所有实体的分页列表;以及
GetDataAutomationLibraryEntity检索有关特定实体的详细信息,包括所有词汇短语。
注意:实体管理不同于库管理。有关创建、更新或删除库的信息,请参阅管理数据自动化库。