Computação e armazenamento Configuração, implantação e execução de funções Solicitações da API do Lambda Outros serviços

Cotas Lambda

Importante

Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.

O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.

É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.

Para ver as cotas que se aplicam à sua conta, navegue até o painel do Service Quotas. Aqui, você pode visualizar suas cotas de serviço, solicitar um aumento de cota e visualizar a utilização atual. Nesse painel, você pode fazer uma busca detalhada por um serviço específico da AWS, como o Lambda:

As seções abaixo listam cotas e limites padrão no Lambda por categoria.

Tópicos

Computação e armazenamento
Configuração, implantação e execução de funções
Solicitações da API do Lambda
Outros serviços

Computação e armazenamento

O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte Solicitar um aumento de cota no Guia do usuário do Service Quotas..

Recurso	Cota padrão	Pode ser aumentado até
Execuções simultâneas	1.000	Dezenas de milhares
Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento. Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte Monitoring Lambda code storage no Serverless Land.	75 GB	Terabytes
Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR.	Consulte Cotas de serviço do Amazon ECR.
Interfaces de rede elásticas por Virtual Private Cloud (VPC) nota Esta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte Cotas da Amazon VPC.	500	Milhares

Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte Como entender a escalabilidade da função do Lambda.

Configuração, implantação e execução de funções

As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.

nota

A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.

Recurso	Quota
Alocação de memória da função	128 MB a 10.240 MB, em incrementos de 1 MB. Observação: o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. É possível aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração Memória (MB). Com 1.769 MB, uma função tem o equivalente a uma vCPU.
Tempo limite da função	900 segundos (15 minutos)
Variáveis de ambiente da função	4 KB, para todas as variáveis de ambiente associadas à função, em agregado
Política baseada em recursos da função	20 KB
Função camadas	5 camadas
Limite de escalabilidade de simultaneidade de funções	Para cada função, mil ambientes de execução a cada dez segundos
Carga da invocação (solicitação e resposta)	6 MB cada para solicitação e resposta (síncrona) 200 MB para cada resposta enviada por streaming (síncrona) 1 MB (assíncrona) 1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação
Largura de banda para respostas enviadas por streamig	Ilimitada para os primeiros 6 MB da resposta da função Para respostas maiores que 6 MB, 2 MBps para o restante da resposta
Tamanho dopacote de implantação (arquivo .zip)	50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3. 50 MB (quando carregado pelo console do Lambda) 250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado).
Tamanho das configurações de imagem de contêiner	16 KB
Tamanho do pacote do código da imagem do contêiner	10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas)
Eventos de teste (editor de console)	10
`/tmp`Armazenamento do diretório do	Entre 512 MB e 10.240 MB, em incrementos de 1 MB
Descrições do arquivo	1,024 nota As instâncias gerenciadas do Lambda usam os limites padrão do descritor de arquivo do Bottlerocket. Para obter mais informações, consulte Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda.
Processos de execução/threads	1,024 nota As instâncias gerenciadas do Lambda usam o processo padrão e os limites de threads do Bottlerocket. Para obter mais informações, consulte Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda.

Solicitações da API do Lambda

As cotas a seguir estão associadas a solicitações de API do Lambda.

Recurso	Quota
Solicitações de invocação por função por região (síncronas)	Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte Como entender a escalabilidade da função do Lambda.
Solicitações de invocação por função por região (assíncronas)	Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte Como entender a escalabilidade da função do Lambda.
Solicitações de invocação por alias ou versão de função (solicitações por segundo)	10 x simultaneidade provisionada alocada nota Essa cota se aplica somente às funções que usam simultaneidade provisionada.
Solicitações da API GetFunction	100 solicitações por segundo. Não pode ser aumentado.
Solicitações de API GetPolicy	15 solicitações por segundo. Não pode ser aumentado.
Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy)	15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado.

Outros serviços

Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte AWS service (Serviço da AWS) quotas, na Referência geral da Amazon Web Services, e Invocando o Lambda com eventos de outros serviços da AWS.

Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.

O teste de carga da aplicação permite monitorar a performance da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Compilar e testar uma aplicação com tecnologia sem servidor

Histórico do documento