# Cotas Lambda
<a name="gettingstarted-limits"></a>

**Importante**  
Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.

O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.

É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.

Para ver as cotas que se aplicam à sua conta, navegue até o [painel do Service Quotas](https://console.aws.amazon.com/servicequotas/home). Aqui, você pode visualizar suas cotas de serviço, solicitar um aumento de cota e visualizar a utilização atual. Nesse painel, você pode fazer uma busca detalhada por um serviço específico da AWS, como o Lambda:

![design de aplicações figura 1](http://docs.aws.amazon.com/pt_br/lambda/latest/dg/images/application-design-figure-1.png)


As seções abaixo listam cotas e limites padrão no Lambda por categoria.

**Topics**
+ [Computação e armazenamento](#compute-and-storage)
+ [Configuração, implantação e execução de funções](#function-configuration-deployment-and-execution)
+ [Solicitações da API do Lambda](#api-requests)
+ [Outros serviços](#quotas-other-services)

## Computação e armazenamento
<a name="compute-and-storage"></a>

O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte [Solicitar um aumento de cota no ](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)Guia do usuário do Service Quotas.**.


| Recurso | Cota padrão | Pode ser aumentado até | 
| --- | --- | --- | 
| Execuções simultâneas | 1.000 | Dezenas de milhares | 
| Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento.<br /> Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte [Monitoring Lambda code storage](https://serverlessland.com/content/service/lambda/guides/aws-lambda-operator-guide/code-storage) no Serverless Land. | 75 GB | Terabytes | 
| Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR. | Consulte [Cotas de serviço do Amazon ECR](https://docs.aws.amazon.com/AmazonECR/latest/userguide/service-quotas.html). |   | 
| [Interfaces de rede elásticas por Virtual Private Cloud (VPC)](configuration-vpc.md) Esta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte [Cotas da Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/amazon-vpc-limits.html).  | 500 | Milhares | 
| Execuções duráveis de execução máxima | 1.000.000 | Milhões | 

Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md).

## Configuração, implantação e execução de funções
<a name="function-configuration-deployment-and-execution"></a>

As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.

**nota**  
A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.


| Recurso | Quota | 
| --- | --- | 
| [Alocação de memória](configuration-memory.md) da função | 128 MB a 10.240 MB, em incrementos de 1 MB.<br />**Observação:** o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. É possível aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração **Memória (MB)**. Com 1.769 MB, uma função tem o equivalente a uma vCPU. | 
| Tempo limite da função | 900 segundos (15 minutos) | 
| [Variáveis de ambiente](configuration-envvars.md) da função | 4 KB, para todas as variáveis de ambiente associadas à função, em agregado | 
| [Política baseada em recursos](access-control-resource-based.md) da função | 20 KB | 
| Função [camadas](chapter-layers.md) | 5 camadas | 
| [Limite de escalabilidade de simultaneidade](scaling-behavior.md) de funções | Para cada função, mil ambientes de execução a cada dez segundos | 
| [Carga da invocação](lambda-invocation.md) (solicitação e resposta) | 6 MB cada para solicitação e resposta (síncrona)<br />200 MB para cada [resposta enviada por streaming](configuration-response-streaming.md) (síncrona)<br />1 MB (assíncrona)<br />1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação | 
| Largura de banda para [respostas enviadas por streamig](configuration-response-streaming.md) | Ilimitada para os primeiros 6 MB da resposta da função<br />Para respostas maiores que 6 MB, 2 MBps para o restante da resposta | 
| Tamanho do[pacote de implantação (arquivo .zip)](configuration-function-zip.md) | 50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3.<br />50 MB (quando carregado pelo console do Lambda)<br />250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado).<br /> | 
| Tamanho das configurações de imagem de contêiner | 16 KB | 
| Tamanho do pacote do código da [imagem do contêiner](images-create.md) | 10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas) | 
| Eventos de teste (editor de console) | 10 | 
| `/tmp`Armazenamento do diretório do  | Entre 512 MB e 10.240 MB, em incrementos de 1 MB | 
| Descrições do arquivo | 1,024 As instâncias gerenciadas do Lambda utilizam um limite mais alto de descritores de arquivo, de 4.096. Para obter mais informações, consulte [Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda](lambda-managed-instances-execution-environment.md).  | 
| Processos de execução/threads | 1,024 As instâncias gerenciadas do Lambda usam o processo padrão e os limites de threads do [Bottlerocket](https://aws.amazon.com/bottlerocket/). Para obter mais informações, consulte [Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda](lambda-managed-instances-execution-environment.md).  | 
| Número máximo de operações duráveis por execução durável | 3.000 Para mais informações, consulte [Operações duráveis disponíveis](durable-execution-sdk.md#durable-sdk-operations).  | 
| Armazenamento de execução durável escrito em megabytes | 100 MB O tamanho cumulativo da carga útil persistiu por funções duráveis por execução. Para mais informações, consulte [dados persistentes por operação durável](durable-execution-sdk.md#durable-operations-checkpoint-consumption).  | 

## Solicitações da API do Lambda
<a name="api-requests"></a>

As cotas a seguir estão associadas a solicitações de API do Lambda.


| Recurso | Quota | 
| --- | --- | 
| Solicitações de invocação por função por região (síncronas) | Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md). | 
| Solicitações de invocação por função por região (assíncronas) | Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md). | 
| Solicitações de invocação por alias ou versão de função (solicitações por segundo) | 10 x [simultaneidade provisionada](configuration-concurrency.md) alocada Essa cota se aplica somente às funções que usam simultaneidade provisionada.  | 
| Solicitações da API [GetFunction](https://docs.aws.amazon.com/lambda/latest/api/API_GetFunction.html) | 100 solicitações por segundo. Não pode ser aumentado. | 
| Solicitações de API [GetPolicy](https://docs.aws.amazon.com/lambda/latest/api/API_GetPolicy.html) | 15 solicitações por segundo. Não pode ser aumentado. | 
| Solicitações da API [CheckpointDurableExecution](https://docs.aws.amazon.com/lambda/latest/api/API_CheckpointDurableExecution.html) | 1,000 solicitações por segundo. | 
| Solicitações da API [GetDurableExecution](https://docs.aws.amazon.com/lambda/latest/api/API_GetDurableExecution.html) | 30 solicitações por segundo. | 
| Solicitações da API [GetDurableExecutionHistory](https://docs.aws.amazon.com/lambda/latest/api/API_GetDurableExecutionHistory.html) | 15 solicitações por segundo. | 
| Solicitações da API [GetDurableExecutionState](https://docs.aws.amazon.com/lambda/latest/api/API_GetDurableExecutionState.html) | 1,000 solicitações por segundo. | 
| Solicitações da API [ListDurableExecutionsByFunction](https://docs.aws.amazon.com/lambda/latest/api/API_ListDurableExecutionsByFunction.html) | 15 solicitações por segundo. | 
| Solicitações da API [SendDurableExecutionCallbackFailure](https://docs.aws.amazon.com/lambda/latest/api/API_SendDurableExecutionCallbackFailure.html) | 300 solicitações por segundo. | 
| Solicitações da API [SendDurableExecutionCallbackHeartbeat](https://docs.aws.amazon.com/lambda/latest/api/API_SendDurableExecutionCallbackHeartbeat.html) | 300 solicitações por segundo. | 
| Solicitações da API [SendDurableExecutionCallbackSuccess](https://docs.aws.amazon.com/lambda/latest/api/API_SendDurableExecutionCallbackSuccess.html) | 300 solicitações por segundo. | 
| Solicitações da API [StopDurableExecution](https://docs.aws.amazon.com/lambda/latest/api/API_StopDurableExecution.html) | 30 solicitações por segundo. | 
| Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy) | 15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado. | 

## Outros serviços
<a name="quotas-other-services"></a>

Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte [AWS service (Serviço da AWS) quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html), na *Referência geral da Amazon Web Services*, e [Invocando o Lambda com eventos de outros serviços da AWS](lambda-services.md).

Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.

O teste de carga da aplicação permite monitorar a performance da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.