View a markdown version of this page

管理模型字符限制的提示 - AWS 上的生成式 AI 應用程式建置器

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

管理模型字符限制的提示

注意:解決方案不會直接嘗試管理各種 LLMs字符限制。測試並確保您的提示保持在模型提供者強制執行的可用限制內。

若要協助控制提示的大小,請嘗試下列動作:

  1. 熟悉您想要使用的模型所施加的限制。這些值在各個模型之間可能會有很大的差異,因此在開始之前,請務必了解可用的預算。

  2. 建立您的初始提示時,請謹記該預算,並考慮要為提示的任何動態元素節省多少成本。例如,使用者輸入、聊天歷史記錄、文件摘錄等。

  3. 在提示組態頁面中,設定追蹤歷史記錄的大小限制,以限制提示中包含的對話轉彎次數。

  4. 在知識庫組態精靈中設定文件傳回限制。您需要嘗試在為 LLM 提供足夠的內容來執行任務之間取得正確的平衡,但不能超過字符限制或對延遲造成負面影響。

  5. 保留一些緩衝區。不要編列典型案例的預算,請考慮並實驗邊緣案例,例如長輸入查詢、大型文件摘錄或長對話。