

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 管理模型字符限制的提示
<a name="tips-for-managing-model-token-limits"></a>

注意：解決方案不會直接嘗試管理各種 LLMs字符限制。測試並確保您的提示保持在模型提供者強制執行的可用限制內。

若要協助控制提示的大小，請嘗試下列動作：

1. 熟悉您想要使用的模型所施加的限制。這些值在各個模型之間可能會有很大的差異，因此在開始之前，請務必了解可用的預算。

1. 建立您的初始提示時，請謹記該預算，並考慮要為提示的任何動態元素節省多少成本。例如，使用者輸入、聊天歷史記錄、文件摘錄等。

1. 在提示組態頁面中，設定**追蹤歷史記錄的大小限制**，以限制提示中包含的對話轉彎次數。

1. 在知識庫組態精靈中設定文件傳回限制。您需要嘗試在為 LLM 提供足夠的內容來執行任務之間取得正確的平衡，但不能超過字符限制或對延遲造成負面影響。

1. 保留一些緩衝區。不要編列典型案例的預算，請考慮並實驗邊緣案例，例如長輸入查詢、大型文件摘錄或長對話。