View a markdown version of this page

Schreiben von Best Practices zur Optimierung von RAG-Anwendungen - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schreiben von Best Practices zur Optimierung von RAG-Anwendungen

Ivan Cui und Samantha Stuart, Amazon Web Services

Juli 2025 (Geschichte der Dokumente)

Große Sprachmodelle (LLMs) haben den Bereich der künstlichen Intelligenz mit ihrer bemerkenswerten Fähigkeit, menschenähnlichen Text zu verstehen und zu generieren, revolutioniert. Sie sind jedoch mit einer erheblichen Einschränkung konfrontiert: Sie können nur mit dem Wissen arbeiten, das in ihren Trainingsdaten enthalten ist. Hier hilft Retrieval Augmented Generation (RAG). Es bietet eine Lösung, die LLMs mit externen Wissensquellen wie den Daten und Dokumenten Ihres Unternehmens kombiniert werden kann. Durch einen zweistufigen Prozess, der das Abrufen von Informationen und die Generierung von Antworten umfasst, ermöglicht RAG KI-Systemen, auf up-to-date Informationen aus verschiedenen Quellen zuzugreifen und diese zu integrieren, was zu genaueren und fundierteren Antworten führt, die die Lücke zwischen statischem Modellwissen und dynamischem Informationsbedarf aus der realen Welt schließen.

Wie können Sie Inhalte für den Abruf in einer RAG-basierten Anwendung optimieren? Dieses Handbuch enthält bewährte Methoden, mit denen Sie die Formatierung und den Schreibstil von textbasierten Inhalten in der Wissensdatenbank optimieren können. Durch die Optimierung des Inhalts wird der Kontext verbessert, sodass RAG-Anwendungen aufgabenspezifische Informationen genauer verstehen können. Wenn das System hochrelevante und genaue Inhalte abruft, verbessert sich die Qualität der Antwort des LLM. Die Optimierung des Kontext-Bereitstellungsprozesses auf Systemebene wird als Kontext-Engineering bezeichnet und ist ein wesentlicher Bestandteil agentischer RAG-Architekturen. In agentic RAG werden vor der RAG-Ausführung ein oder mehrere zusätzliche LLMs Gründe und Aktionen auf Eingangsanforderungen angewendet. Dies erleichtert einen mehrstufigen Informationsbereitstellungsprozess. Da die RAG-Architekturen immer komplexer werden, ist die Optimierung von Quellinhalten nach wie vor das direkteste Mittel, um einen klaren Kontext zu liefern. LLMs Diese bewährten Methoden sollen Ihnen helfen, die Investition Ihres Unternehmens in eine RAG-Anwendung optimal zu nutzen.

Zielgruppe

Dieser Leitfaden richtet sich an KI-Ingenieure, Datenwissenschaftler, Dateningenieure oder Softwareentwickler, die LLM-Anwendungen mit einer oder mehreren RAG-Komponenten erstellen. Um die Konzepte und Empfehlungen in diesem Handbuch zu verstehen, sollten Sie mit Vektordatenbanken und deren Eingabeaufforderungen vertraut sein. LLMs

Ziele

Die Empfehlungen in diesem Handbuch können Ihnen dabei helfen, Folgendes zu erreichen:

  • Verbessern Sie die Genauigkeit und Relevanz der von RAG-Anwendungen generierten Antworten, indem Sie gut strukturierte und semantisch umfangreiche Quelldokumente bereitstellen, die für die Verwendung von Token und Redundanz optimiert sind.

  • Helfen Sie RAG-Anwendungen, domänenspezifisches Wissen und Kontext besser zu verstehen, indem Sie klare Definitionen und Erklärungen in den Quelldokumenten bereitstellen.

  • Erleichtern Sie die Wartung und Aktualisierung der Wissensdatenbank für RAG-Anwendungen, indem Sie in allen Quelldokumenten einheitliche Formatierungs- und Strukturierungsrichtlinien einhalten.

  • Verbessern Sie die Skalierbarkeit von RAG-Lösungen, indem Sie große, monolithische Dokumente in kleinere, eigenständige Einheiten aufteilen, die effizient indexiert und abgerufen werden können.