Práticas recomendadas de documentação para aplicativos RAG

O desenvolvimento de um aplicativo bem-sucedido de Retrieval-Augmented Generation (RAG) requer uma análise cuidadosa de vários fatores relacionados a documentos para otimizar seu desempenho. As melhores práticas nesta seção são selecionadas com base na experiência na criação de sistemas RAG com muitos líderes organizacionais. A seguir estão algumas das principais práticas recomendadas para documentos para aprimorar a eficácia de seu aplicativo RAG:

Use cabeçalhos e subtítulos adequadamente — Organizar seu conteúdo com cabeçalhos e subtítulos claros melhora a legibilidade e ajuda os modelos do RAG a entender a estrutura de seus documentos. Essa prática permite que os modelos naveguem melhor e extraiam informações dos documentos, o que melhora a qualidade das respostas geradas.
Certifique-se de que a numeração seja sequencial — Ao usar listas numeradas, é importante manter a numeração correta para evitar confusão. Certifique-se de que cada item da lista seja numerado sequencialmente sem pular números. Isso ajuda a manter a clareza e a coerência em seu conteúdo.
Adicionar transições entre itens da lista — Fornecer transições entre itens em uma lista numerada ou com marcadores ajuda a orientar o LLM pelo conteúdo. Por exemplo, você pode usar frases como “Depois de concluir a etapa 2, faça...” para conectar ideias e melhorar o fluxo de informações.
Substituir tabelas — Evite usar tabelas. Formate essas informações em listas com marcadores de vários níveis ou em uma sintaxe de nível simples. A sintaxe de nível plano é organizar elementos ou itens no mesmo nível hierárquico, sem níveis aninhados de subordinação. Essas estruturas ajudam LLMs a digerir as informações. Como a maioria dos documentos indexados é lida da esquerda para a direita, a sintaxe de nível simples permite que as informações sejam acompanhadas de forma mais coerente sem precisar referenciar uma dimensão adicional. Esse formato é mais propício para aplicativos RAG porque apresenta as informações de forma estruturada e de fácil digestão.
Pré-processe informações gráficas para maior eficiência — o multimodal LLMs pode ingerir imagens e texto. Reduza a resolução das imagens, remova imagens redundantes e descreva o conteúdo dos elementos gráficos em formato de texto. Essas medidas melhoram o contexto significativo, evitam o consumo desnecessário de tokens e melhoram a acessibilidade dos modelos RAG.
Adicione iniciadores de sessão para consultas comuns — Ao abordar questões ou tarefas comuns, como “Como faço para solicitar software?” , adicione um iniciador de sessão que faça a transição do leitor para o processo. Por exemplo, você pode adicionar “Se você deseja solicitar um software, siga as etapas abaixo...”. Isso ajuda a criar uma alta correspondência semântica, o que ajuda o LLM a construir uma resposta coesa.
Adicione um resumo a cada seção — Depois de cada título ou subtítulo, adicione um resumo breve e conciso do conteúdo dessa seção. Isso pode aumentar a cobertura semântica e reforçar os pontos-chave. Isso melhora a precisão da pesquisa por similaridade no espaço de incorporação, melhorando assim o desempenho do aplicativo RAG. Isso é particularmente útil se o documento for destinado tanto ao LLM quanto ao consumo humano ou se elementos gráficos e de tabela forem necessários.
Desambiguação — Os documentos devem ser concisos e focados. LLMs gere respostas com base em trechos recuperados, para que a desambiguação ajude o modelo a usar informações claras e relevantes. Isso resulta em respostas mais precisas e informativas.
Defina abreviações e defina o contexto — LLMs são treinados em grande quantidade de dados da Internet e, na maioria das vezes, não têm o contexto dos documentos internos de uma empresa. Portanto, definir o contexto, definir abreviações e evitar ou definir a terminologia específica da empresa ajuda o LLM a entender seus dados corporativos. Isso ajuda o LLM a responder às perguntas com mais precisão e pode ajudar a evitar alucinações.
Reestruture documentos grandes em documentos menores para marcação e indexação eficientes — Evite indexar um documento grande que contenha vários subtópicos. Considere dividir o documento grande em documentos menores e independentes que tenham títulos claros. Isso melhora a indexação e a marcação.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Desafios nos dados de origem

Perguntas frequentes