

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 修改您的 Amazon Bedrock 知识库的数据来源
<a name="kb-ds-update"></a>

您可以更新知识库的数据来源，例如更改数据来源配置。

您可以使用以下方法更新数据来源：
+ 添加、更改或移除数据来源中的文件或内容。
+ 更改数据来源配置或用于在数据摄取期间加密临时数据的 KMS 密钥。如果您更改来源或端点配置详细信息，则应更新或创建具有所需访问权限和 Secrets Manager 密钥（如果适用）的新 IAM 角色。
+ 将您的数据来源删除策略设置为“Delete”或“Retain”。删除知识库或数据来源资源后，您可以删除数据来源中所有转换为向量嵌入的数据。删除知识库或数据来源资源后，您可以保留数据来源中所有转换为向量嵌入的数据。请注意，如果您删除知识库或数据来源资源，则**向量存储本身不会被删除**。

每次在数据来源中添加、修改或删除文件时，您都必须同步数据来源，以便将其重新索引到知识库中。同步是增量式的，因此 Amazon Bedrock 仅处理自上次同步以来添加、修改或删除的文档。在开始摄取之前，请检查您的数据来源是否满足以下条件：
+ 文件采用受支持的格式。有关更多信息，请参阅[支持的文档格式](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits)。
+ 这些文件不超过 AWS 一般参考 中的 [Amazon Bedrock endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/bedrock.html) 中指定的**摄取作业文件大小**。
+ 如果您的数据来源包含元数据文件，请检查以下条件以确保元数据文件不会被忽略：
  + 每个 `.metadata.json` 文件都与其关联的源文件共享相同的文件名和扩展名。
  + 如果知识库的向量索引位于 Amazon OpenSearch 无服务器向量存储中，请检查向量索引是否使用 `faiss` 引擎配置。如果向量索引是使用 `nmslib` 引擎配置，则您必须执行以下操作之一：
    + 在控制台中[创建新的知识库](knowledge-base-create.md)，让 Amazon Bedrock 在 Amazon OpenSearch 无服务器中自动为您创建向量索引。
    + 在向量存储中[创建另一个向量索引](knowledge-base-setup.md)，然后选择 `faiss` 作为**引擎**。然后[创建新的知识库](knowledge-base-create.md)并指定新的向量索引。
  + 如果知识库的向量索引位于 Amazon Aurora 数据库集群中，我们建议您使用自定义元数据字段将所有元数据存储在单列中，并对该列创建索引。如果未提供自定义元数据字段，那么必须在开始摄取之前，检查索引表格是否包含元数据文件中每个元数据属性的列。有关更多信息，请参阅[将您创建的向量存储用于知识库的先决条件](knowledge-base-setup.md)。

要了解如何更新数据来源，请选择与您的首选方法对应的选项卡，然后按照以下步骤操作：

------
#### [ Console ]

**更新数据来源**

1. 采用有权使用 Amazon Bedrock 控制台的 IAM 身份登录 AWS 管理控制台。然后，通过以下网址打开 Amazon Bedrock 控制台：[https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)。

1. 在左侧导航窗格中，选择**知识库**。

1. 选择知识库的名称。

1. 在**数据来源**部分，选中要编辑和同步的数据来源旁边的单选按钮。

1. （可选）选择**编辑**，更改您的配置，然后选择**提交**。如果您更改来源或端点配置详细信息，则应更新或创建具有所需访问权限和 Secrets Manager 密钥（如果适用）的新 IAM 角色。另请注意，您无法更改基于摄取的原始数据的分块配置。您必须重新创建数据来源。
**注意**  
您无法更改分块配置。您必须重新创建数据来源。

1. （可选）选择在高级设置中编辑您的数据来源数据删除策略：

   对于数据删除策略设置，您可以选择以下项之一：
   + 删除：删除知识库或数据来源资源后，会删除数据来源中所有转换为向量嵌入的数据。请注意，**向量存储本身不会被删除**，只有数据会被删除。如果删除了 AWS 账户，则会忽略此标志。
   + 保留：删除知识库或数据来源资源后，会保留数据来源中所有转换为向量嵌入的数据。请注意，如果您删除知识库或数据来源资源，则**向量存储本身不会被删除**。

1. 选择**同步**。

1. 同步完成且**状态**变为**就绪**时，会出现绿色横幅。

------
#### [ API ]

**更新数据来源**

1. （可选）使用 [Amazon Bedrock 代理构建时端点](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)发送 [UpdateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_UpdateDataSource.html) 请求，更改所有配置并指定您不想更改的相同配置。如果您更改来源或端点配置详细信息，则应更新或创建具有所需访问权限和 Secrets Manager 密钥（如果适用）的新 IAM 角色。
**注意**  
您无法更改 `chunkingConfiguration`。使用现有 `chunkingConfiguration` 发送请求，或者重新创建数据来源。

1. （可选）更改数据来源的 `dataDeletionPolicy`。删除知识库或数据来源资源后，您可以 `DELETE` 数据来源中所有转换为向量嵌入的数据。如果删除了 AWS 账户，则会忽略此标志。删除知识库或数据来源资源后，您可以 `RETAIN` 数据来源中所有转换为向量嵌入的数据。请注意，如果您删除知识库或数据来源资源，则**向量存储本身不会被删除**。

1. 使用 [Amazon Bedrock 代理构建时端点](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)发送 [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html) 请求，指定 `dataSourceId` 和 `knowledgeBaseId`。

------