As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criação de arquiteturas sem servidor para IA agêntica em AWS
<a name="introduction"></a>

*Aaron Sempf, Amazon Web Services*

*Janeiro de 2026* ([histórico do documento](doc-history.md))

A convergência da IA e da computação sem servidor está remodelando o cenário da arquitetura corporativa moderna. Em resposta, as organizações estão se esforçando para oferecer recursos inteligentes em grande escala. Eles enfrentam uma pressão crescente para reduzir a sobrecarga operacional, acelerar a inovação e implantar aplicativos que possam se adaptar em tempo real ao comportamento do usuário e aos eventos do sistema.

A IA sem servidor AWS representa uma mudança fundamental em direção a sistemas inteligentes, adaptáveis e nativos da nuvem. Com a estratégia e as ferramentas certas, as organizações podem desbloquear ciclos de inovação mais rápidos, custos mais baixos e maior escalabilidade. Essa abordagem os posiciona na vanguarda da próxima geração de computação corporativa. AWS está possibilitando essa mudança por meio de uma combinação de serviços de IA totalmente gerenciados e infraestrutura sem servidor orientada a eventos.

Este guia descreve os fundamentos estratégicos e técnicos para a criação de arquiteturas sem servidor nativas de IA em. AWS Essas arquiteturas são escaláveis, econômicas e capazes de fornecer inteligência em tempo real sem a complexidade do gerenciamento da infraestrutura.

## Público-alvo
<a name="intended-audience"></a>

Este guia é para arquitetos, desenvolvedores e líderes de tecnologia que buscam aproveitar o poder dos agentes de software orientados por IA em aplicativos modernos nativos da nuvem.

## Objetivos
<a name="objectives"></a>

Este guia ajuda você a:
+ Entenda os serviços AWS nativos disponíveis para o desenvolvimento de soluções de IA agênticas
+ Operacionalize a IA agente com confiabilidade em escala de nuvem
+ Alinhe a execução da IA com resultados de negócios e modelos de custo
+ Estabeleça uma estrutura para adoção segura e governada da IA

## Sobre esta série de conteúdo
<a name="content-series"></a>

Este guia faz parte de uma série sobre IA agente em AWS. Para obter mais informações e ver os outros guias desta série, consulte [Agentic AI](https://aws.amazon.com/prescriptive-guidance/agentic-ai/) no site da AWS Prescriptive Guidance.

## O caso de negócios da IA sem servidor
<a name="business-case"></a>

A computação sem servidor fornece uma base ideal para cargas de trabalho modernas de IA. Os aplicativos de IA geralmente exigem inferência intermitente e com uso intensivo de computação, especialmente em casos de uso como detecção de fraudes, mecanismos de recomendação, resumo de documentos e automação do atendimento ao cliente. Os modelos tradicionais de infraestrutura podem ser caros e operacionalmente complexos ao gerenciar cargas de trabalho imprevisíveis ou com picos de pico.

Por outro lado, as arquiteturas sem servidor oferecem vantagens significativas. Eles escalam automaticamente, executam sob demanda, reduzem a sobrecarga operacional e cobram somente pelos recursos usados. Esses recursos tornam as arquiteturas sem servidor adequadas para incorporar a IA em aplicativos modernos nativos da nuvem. AWS oferece um portfólio abrangente de serviços que combinam recursos sem servidor e de IA. Esses serviços incluem o Amazon SageMaker Serverless Inference e o Amazon Bedrock, que fornecem acesso aos modelos básicos por meio de uma interface totalmente gerenciada e baseada em API. O Amazon Bedrock AgentCore estende o Amazon Bedrock além do acesso ao modelo para um tempo de execução completo para criar, implantar e gerenciar agentes autônomos. 

Além disso, AWS Lambda AWS Step Functions possibilite o desenvolvimento de sistemas de IA ágeis, alinhados aos custos e prontos para a produção. Quando combinados com serviços como Amazon Bedrock, SageMaker Serverless Inference e AgentCore, eles fornecem recursos integrados de raciocínio, memória e conectores, permitindo que os desenvolvedores criem agentes que podem planejar, agir e colaborar entre sistemas externos. Serviços da AWS Essas ferramentas oferecem suporte poderoso para cargas de trabalho de IA, tudo dentro de uma arquitetura sem servidor e orientada por eventos.

As cargas de trabalho de IA, especialmente a inferência, geralmente são imprevisíveis e intermitentes. Nas arquiteturas tradicionais, isso leva a uma infraestrutura superprovisionada, ao aumento dos custos e à complexidade do escalonamento. Os modelos sem servidor resolvem esses problemas oferecendo:
+ **Escalabilidade elástica** — os recursos são escalados automaticamente com base na demanda.
+ **Otimização de custos** — sem cobranças por computação ociosa. Pague somente pelo tempo de execução.
+ **Redução da sobrecarga operacional** — menos operações, menos tarefas para gerenciar e menos dependências de outras tecnologias, processos ou recursos.
+ **Tempo de comercialização mais rápido** — os desenvolvedores podem se concentrar na lógica de negócios e no desempenho do modelo em vez de gerenciar servidores.
+ **Alta disponibilidade e resiliência integrada** — as ofertas AWS sem servidor fornecem esses recursos por padrão.

Esses recursos tornam a tecnologia sem servidor uma opção natural para a implantação de modelos de IA em uma ampla variedade de casos de uso, desde detecção de fraudes e recomendações personalizadas até análise de documentos e IA conversacional.

## Serviços da AWS potencializando a IA sem servidor
<a name="aws-services-powering"></a>

AWS fornece um conjunto robusto de serviços gerenciados que ajudam as equipes a incorporar inteligência aos aplicativos, orquestrar fluxos de trabalho e reagir a eventos sem gerenciar a infraestrutura:
+ Com [AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/welcome.html), você pode executar cargas de trabalho de computação orientadas por eventos em grande escala sem provisionar servidores. É ideal para pré-processamento e pós-processamento de IA e lógica de inferência leve.
+ Use o [Amazon SageMaker Serverless Inference](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints.html) para implantar modelos de aprendizado de máquina (ML) para previsões em tempo real com escalabilidade automática e sem custos inativos.
+ O [Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html) fornece acesso a modelos básicos das principais empresas de IA [https://aws.amazon.com/bedrock/ai21/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/ai21/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77), como [https://aws.amazon.com/bedrock/anthropic/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D](https://aws.amazon.com/bedrock/anthropic/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D),, [https://aws.amazon.com/bedrock/cohere/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D](https://aws.amazon.com/bedrock/cohere/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77&ams%23interactive-card-vertical%23pattern-data.filter=%257B%2522filters%2522%253A%255B%255D%257D), [https://aws.amazon.com/bedrock/deepseek/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/deepseek/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77), [https://aws.amazon.com/bedrock/luma-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77](https://aws.amazon.com/bedrock/luma-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77), [https://aws.amazon.com/bedrock/meta/](https://aws.amazon.com/bedrock/meta/), [https://aws.amazon.com/bedrock/poolside/](https://aws.amazon.com/bedrock/poolside/)(em breve), [Stability AI](https://aws.amazon.com/bedrock/stability-ai/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77), [https://aws.amazon.com/bedrock/twelvelabs/](https://aws.amazon.com/bedrock/twelvelabs/), e [Amazon](https://aws.amazon.com/ai/generative-ai/nova/?refid=ca65de14-f133-4047-b100-90c1bfbdfe77) por meio de uma única API para cargas de trabalho generativas de IA.
+ Com o [Amazon Bedrock Agents](https://docs.aws.amazon.com/bedrock/latest/userguide/agents.html), você pode criar fluxos de trabalho orientados por IA em que os modelos orquestram chamadas de funções e raciocinam por meio de tarefas usando linguagem natural.
+ O [Amazon Bedrock AgentCore](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/what-is-bedrock-agentcore.html) fornece os recursos básicos de tempo de execução, memória e conectores que simplificam a criação e a escalabilidade de sistemas multiagentes. A AgentCore integração a um design sem servidor permite que os desenvolvedores criem agentes adaptáveis e sensíveis ao contexto de forma nativa, AWS sem gerenciar a orquestração personalizada ou o tratamento de estado.
+ [A Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) permite que você crie arquiteturas fracamente acopladas e orientadas por eventos que acionam fluxos de trabalho de IA automaticamente.
+ Use [AWS Step Functions](https://docs.aws.amazon.com/step-functions/latest/dg/welcome.html)para orquestrar pipelines de IA em várias etapas e se conectar Serviços da AWS usando fluxos de trabalho visuais.
+ Com o [Lambda @Edge [AWS IoT Greengrass](https://docs.aws.amazon.com/greengrass/v2/developerguide/what-is-iot-greengrass.html)](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/lambda-at-the-edge.html)e o Lambda, você pode implantar modelos e lógica na borda para inferência de baixa latência em IoT e aplicativos globais.