Cotas Lambda
Importante
Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.
O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.
É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.
Para ver as cotas que se aplicam à sua conta, navegue até o painel do Service Quotas
     
     
  As seções abaixo listam cotas e limites padrão no Lambda por categoria.
Tópicos
Computação e armazenamento
O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte Solicitar um aumento da cota no Manual do usuário do Service Quotas.
| Recurso | Cota padrão | Pode ser aumentado até | 
|---|---|---|
| 
               Execuções simultâneas  | 
            
               1.000  | 
            
               Dezenas de milhares  | 
          
| 
               Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento.  Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte Monitoring Lambda code storage  | 
            
               75 GB  | 
            
               Terabytes  | 
          
| 
               Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR.  | 
            
               Consulte Cotas de serviço do Amazon ECR.  | 
            
               
  | 
          
| 
               Interfaces de rede elásticas por Virtual Private Cloud (VPC) notaEsta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte Cotas da Amazon VPC.  | 
            
               500  | 
            
               Milhares  | 
          
Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte Como entender a escalabilidade da função do Lambda.
Configuração, implantação e execução de funções
As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.
nota
A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.
| Recurso | Quota | 
|---|---|
| 
               Alocação de memória da função  | 
            
               128 MB a 10.240 MB, em incrementos de 1 MB. Observação: o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. Você pode aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração Memória (MB). Com 1.769 MB, uma função tem o equivalente a uma vCPU.  | 
          
| 
               Tempo limite da função  | 
            
               900 segundos (15 minutos)  | 
          
| 
               Variáveis de ambiente da função  | 
            
               4 KB, para todas as variáveis de ambiente associadas à função, em agregado  | 
          
| 
               Política baseada em recursos da função  | 
            
               20 KB  | 
          
| 
               Função camadas  | 
            
               cinco camadas  | 
          
| 
               Limite de escalabilidade de simultaneidade de funções  | 
            
               Para cada função, mil ambientes de execução a cada dez segundos  | 
          
| 
               Carga da invocação (solicitação e resposta)  | 
            
               6 MB cada para solicitação e resposta (síncrona) 200 MB para cada resposta enviada por streaming (síncrona) 256 KB (assíncrona) 1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação  | 
          
| 
               Largura de banda para respostas enviadas por streamig  | 
            
               Ilimitada para os primeiros 6 MB da resposta da função Para respostas maiores que 6 MB, 2 MBps para o restante da resposta  | 
          
| 
               Tamanho dopacote de implantação (arquivo .zip)  | 
            
               50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3. 50 MB (quando carregado pelo console do Lambda) 250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado).  | 
          
| 
               Tamanho das configurações de imagem de contêiner  | 
            
               16 KB  | 
          
| 
               Tamanho do pacote do código da imagem do contêiner  | 
            
               10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas)  | 
          
| 
               Eventos de teste (editor de console)  | 
            
               10  | 
          
| 
               Armazenamento do diretório do   | 
            
               Entre 512 MB e 10.240 MB, em incrementos de 1 MB  | 
          
| 
               Descrições do arquivo  | 
            
               1,024  | 
          
| 
               Processos de execução/threads  | 
            
               1,024  | 
          
Solicitações da API do Lambda
As cotas a seguir estão associadas a solicitações de API do Lambda.
| Recurso | Quota | 
|---|---|
| 
               Solicitações de invocação por função por região (síncronas)  | 
            
               Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte Como entender a escalabilidade da função do Lambda.  | 
          
| 
               Solicitações de invocação por função por região (assíncronas)  | 
            
               Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte Como entender a escalabilidade da função do Lambda.  | 
          
| 
               Solicitações de invocação por alias ou versão de função (solicitações por segundo)  | 
            
               10 x simultaneidade provisionada alocada notaEssa cota se aplica somente às funções que usam simultaneidade provisionada.  | 
          
| 
               Solicitações da API GetFunction  | 
            
               100 solicitações por segundo. Não pode ser aumentado.  | 
          
| 
               Solicitações de API GetPolicy  | 
            
               15 solicitações por segundo. Não pode ser aumentado.  | 
          
| 
               Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy)  | 
            
               15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado.  | 
          
Outros serviços
Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte AWS service (Serviço da AWS) quotas, na Referência geral da Amazon Web Services, e Invocando o Lambda com eventos de outros serviços da AWS.
Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.
O teste de carga do aplicativo permite monitorar o desempenho da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.