本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
文件中繼資料
您可以將中繼資料新增至 Amazon S3 儲存貯體中的文件,以自訂聊天結果並控制文件層級存取。中繼資料是文件的其他資訊,例如其標題、建立日期和存取許可。
Amazon Quick 支援具有引文的來源屬性。如果您指定_source_uri中繼資料欄位,聊天中的來源屬性連結會將使用者導向至設定的 URL。如果您未指定 _source_uri,使用者仍然可以透過在查詢時間下載檔案的可點選引文連結存取來源文件。
文件中繼資料位置
在 Amazon S3 中,每個中繼資料檔案都可與索引文件關聯。您的中繼資料檔案必須存放在與索引檔案相同的 Amazon S3 儲存貯體中。在 Amazon Quick 中設定 Amazon S3 整合時,您可以在中繼資料檔案的 Amazon S3 儲存貯體中指定位置。
如果您未指定 Amazon S3 字首,您的中繼資料檔案必須存放在與索引文件相同的位置。如果您為中繼資料檔案指定 Amazon S3 字首,它們必須位於與索引文件平行的目錄結構中。Amazon Quick 只會在中繼資料的指定目錄中尋找 。如果中繼資料未被讀取,請檢查目錄位置是否與中繼資料的位置相符。
下列範例說明索引文件位置如何對應到中繼資料檔案位置。文件的 Amazon S3 金鑰會附加至中繼資料的 Amazon S3 字首,然後使用 加上尾碼.metadata.json,以形成中繼資料檔案的 Amazon S3 路徑。
注意
合併的 Amazon S3 金鑰、中繼資料的 Amazon S3 字首和.metadata.json尾碼總計不得超過 1,024 個字元。建議您的 Amazon S3 金鑰小於 1,000 個字元,以便在將金鑰與字首和字尾結合時考慮額外的字元。
範例範例 1:未指定中繼資料路徑
Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
範例範例 2:指定的中繼資料路徑
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json
文件中繼資料結構
您可在 JSON 檔案中定義文件的中繼資料。檔案必須為不含 BOM 標記的 UTF-8 文字檔案。JSON 檔案的檔名必須為 <document>.<extension>.metadata.json。在此範例中, document 是中繼資料套用到的文件名稱,而 extension是文件的副檔名。文件 ID 在 <document>.<extension>.metadata.json 中必須是唯一的。
JSON 檔案內容採用以下範本格式:
{ "DocumentId": "document ID", "Attributes": { "_authors": ["author of the document"], "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed }, "AccessControlList": [ { "Name": "user1@example.com", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "PDF | HTML | MS_WORD | PLAIN_TEXT | PPT | RTF | XML | XSLT | MS_EXCEL | CSV | JSON | MD" }
如果您提供中繼資料路徑,請確定中繼資料目錄內的目錄結構完全符合資料檔案的目錄結構。
例如,若資料檔案位於 s3://bucketName/documents/legal/file.txt,則中繼資料檔案應位於 s3://bucketName/metadata/documents/legal/file.txt.metadata.json。
所有屬性與欄位皆為選用項目,因此無須全部納入。但若您選擇包含某個屬性,則必須為其設定值,且不得為空。
_created_at 與 _last_updated_at 中繼資料欄位的值均須採用 ISO 8601 日期編碼格式。例如,2012-03-25T12:30:10+01:00 表示以 ISO 8601 格式記錄的時間:歐洲中部時間 2012 年 3 月 25 日 12:30 (加 10 秒)。
AccessControlList 欄位是選用的陣列,可定義文件層級存取控制。陣列中的每個項目都包含下列欄位:
-
Name–USER類型為 Quick 中使用者的電子郵件地址。對於GROUP類型,為 Quick 中的群組名稱。 -
Type–USER或GROUP。 -
Access–ALLOW或DENY。
注意
若要使用 AccessControlList 欄位,您必須在建立知識庫時啟用文件層級 ACLs。如需詳細資訊,請參閱文件層級 ACLs。