Elección de un tipo de instancia de DLAMI
En general, tenga en cuenta lo siguiente al escoger un tipo de instancia para una DLAMI.
Si acaba de llegar al mundo del aprendizaje profundo, una instancia con una sola GPU podría ser suficiente para sus necesidades.
Si le preocupa su presupuesto, puede usar instancias que solo funcionen con CPU.
Si busca optimizar el alto rendimiento y la rentabilidad para la inferencia de modelos de aprendizaje profundo, puede utilizar instancias con chips de AWS Inferentia.
Si busca una instancia de GPU de alto rendimiento con una arquitectura de CPU basada en Arm64, puede usar el tipo de instancia de G5g.
Si está interesado en ejecutar un modelo previamente entrenado para inferencias y predicciones, puede asociar una Amazon Elastic Inference a su instancia de Amazon EC2. Amazon Elastic Inference le da acceso a un acelerador con una fracción de GPU.
-
Para los servicios de inferencia de gran volumen, una única instancia de CPU con mucha memoria, o un clúster de dichas instancias, podría ser una mejor solución.
Si está utilizando un modelo de gran tamaño con muchos datos o un tamaño de lote elevado, necesitará una instancia más grande con más memoria. También puede distribuir su modelo a un clúster de GPU. El uso de una instancia con menos memoria puede ser una solución más adecuada para usted si disminuye el tamaño del lote. Sin embargo, puede afectar a la precisión y a la velocidad de entrenamiento.
Si desea ejecutar aplicaciones de machine learning con la Biblioteca de comunicación colectiva de NVIDIA (NCCL) que requieran un alto nivel de comunicaciones entre nodos a escala, puede utilizar Elastic Fabric Adapter (EFA).
Para obtener más información sobre las instancias, consulte Tipos de instancias EC2
Los siguientes temas proporcionan información acerca de las consideraciones del tipo de instancia.
importante
Las AMI de aprendizaje profundo incluyen controladores, software o conjuntos de herramientas desarrollados o facilitados por NVIDIA Corporation o que son de su propiedad. Debe aceptar que va a utilizar esos controladores, el software o esos conjuntos de herramientas de NVIDIA solo en instancias de Amazon EC2 que incluyan hardware de NVIDIA.
Temas
Precios de la DLAMI
Los marcos de trabajo de aprendizaje profundo incluidos en la DLAMI son gratuitos, y cada uno tiene sus propias licencias de código abierto. Aunque el software incluido en la DLAMI es gratuito, tendrá que pagar por el hardware de la instancia de Amazon EC2 subyacente.
Algunos tipos de instancias de Amazon EC2 se ofrecen de forma gratuita. Es posible ejecutar la DLAMI en una de estas instancias gratuitas. Esto significa que usar DLAMI es totalmente gratis cuando solo se usa la capacidad de dicha instancia. Si decide que desea una instancia más potente, con más núcleos de CPU, más espacio en disco, más RAM y una o varias GPU, lo más probable es que esa instancia no se incluya en la capa gratuita.
Para obtener más información acerca de cómo escoger las instancias y sus precios, consulte Precios de Amazon EC2
Disponibilidad en las regiones de DLAMI
Cada región admite tipos de instancias distintos y, a menudo, un tipo de instancia tiene un costo ligeramente distinto en diferentes regiones. Las DLAMI no están disponibles en todas las regiones, pero es posible copiarlas de una región a otra. Para obtener más información, consulte Copiar una DLAMI. Fíjese en la lista de selección de regiones y asegúrese de que elige una región que esté cerca de usted o de sus clientes. Si tiene previsto utilizar más de una DLAMI y posiblemente crear un clúster, asegúrese de utilizar la misma región para todos los nodos del clúster.
Para obtener más información sobre las regiones, visite en Puntos de conexión del servicio de Amazon EC2.
Tema siguiente
Instancias de GPU recomendadas