Requisitos y prácticas recomendadas para crear productos de machine learning - AWS Marketplace

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos y prácticas recomendadas para crear productos de machine learning

Es importante que a sus compradores les resulte fácil probar sus productos de paquete de modelos y algoritmos. En las siguientes secciones se describen las prácticas recomendadas de productos de ML. Para ver un resumen completo de los requisitos y recomendaciones, consulte Resumen de los requisitos y recomendaciones para los listados de productos de ML.

nota

Un representante de AWS Marketplace podría ponerse en contacto con usted para ayudarle a cumplir estos requisitos si los productos publicados no los cumplen.

Prácticas recomendadas generales para productos de ML

Proporcione la siguiente información para su producto de machine learning:

  • Para las descripciones de los productos, incluya lo siguiente:

    • Qué hace su modelo

    • Quién es el cliente de destino

    • Cuál es el caso de uso más importante

    • Cómo se entrenó su modelo o la cantidad de datos que se usaron

    • Cuáles son las métricas de rendimiento y los datos de validación utilizados

    • Si es médico, si su modelo es o no para uso diagnóstico

  • De forma predeterminada, los productos de machine learning están configurados para tener visibilidad pública. Sin embargo, puede crear un producto con visibilidad limitada. Para obtener más información, consulte Paso 7: configurar la lista de permitidos.

  • (Opcional) En el caso de los productos de pago, ofrezca una prueba gratuita de 14 a 30 días para que los clientes prueben su producto. Para obtener más información, consulte Precios de productos de machine learning para AWS Marketplace.

Requisitos de información de uso

Una información de uso clara que describa las entradas y salidas esperadas del producto (con ejemplos) es fundamental para que el comprador disfrute de una experiencia positiva.

Con cada nueva versión de su recurso que añada a su listado de productos, debe proporcionar información de uso.

Para editar la información de uso existente de una versión específica, consulte Actualización de la información de la versión.

Requisitos de entradas y salidas

Es importante una explicación clara de los parámetros de entrada admitidos y los parámetros de salida devueltos con ejemplos para ayudar a los compradores a entender y utilizar su producto. Esta comprensión ayuda a los compradores a realizar las transformaciones necesarias en los datos de entrada para obtener los mejores resultados de inferencia.

Se le solicitará lo siguiente cuando añada su recurso de Amazon SageMaker AI a su listado de productos.

Entradas y salidas de inferencia

Para la entrada de inferencias, proporcione una descripción de los datos de entrada que espera su producto tanto para el punto de conexión en tiempo real como para el trabajo de transformación por lotes. Incluya fragmentos de código para cualquier procesamiento previo de los datos que sea necesario. Incluya limitaciones si procede. Proporcione muestras de entrada alojadas en GitHub.

Para la salida de inferencias, proporcione una descripción de los datos de salida que devuelve su producto tanto para el punto de conexión en tiempo real como para el trabajo de transformación por lotes. Incluya limitaciones si procede. Proporcione muestras de salida alojadas en GitHub.

En el caso de los ejemplos, proporcione archivos de entrada que funcionen con su producto. Si su modelo realiza una clasificación multiclase, debe proporcionar al menos un archivo de entrada de muestra para cada una de las clases.

Entradas de formación

En la sección Información para entrenar un modelo, proporcione el formato de los datos de entrada y los fragmentos de código para cualquier procesamiento previo de los datos que sea necesario. Incluya una descripción de los valores y las limitaciones si procede. Proporcione muestras de entrada alojadas en GitHub.

Explique las funciones opcionales y obligatorias que puede proporcionar el comprador y especifique si se admite el modo de entrada PIPE. Si se admite el entrenamiento distribuido (entrenamiento con más de una instancia de CPU/GPU), especifíquelo. Para ajustar, indique los hiperparámetros recomendados.

Requisitos para el cuaderno de Jupyter

Cuando añada su recurso de SageMaker AI a su listado de productos, proporcione un enlace a un ejemplo de cuaderno de Jupyter alojado en GitHub que muestre el flujo de trabajo completo sin pedirle al comprador que cargue o busque ningún dato.

Utilice la AWS SDK for Python (Boto). Un cuaderno de muestra bien desarrollado facilita que los compradores prueben y usen su listado.

En el caso de los productos de paquetes de modelos, su cuaderno de muestra indica cómo se preparan los datos de entrada, se crea un punto de conexión para realizar inferencias en tiempo real y se realizan los trabajos de transformación por lotes. Para obtener más información, consulte el listado de paquetes de modelos y el cuaderno de muestra en GitHub. Para ver un ejemplo de cuaderno, consulte auto_insurance. Este cuaderno funciona en todas las Regiones de AWS, sin necesidad de introducir ningún parámetro y sin que el comprador necesite localizar los datos de la muestra.

nota

Un ejemplo de cuaderno de Jupyter poco desarrollado y que no muestre las múltiples entradas posibles y los pasos de preprocesamiento de los datos podría dificultar que el comprador comprenda completamente la propuesta de valor del producto.

Para los productos algorítmicos, el cuaderno de muestra indica el entrenamiento completo, el ajuste, la creación de modelos, la creación de un punto de conexión para la inferencia en tiempo real y el rendimiento de los trabajos de transformación por lotes. Para obtener más información, consulte Algorithm listing and Sample notebook en GitHub. Para ver cuadernos de muestra, consulte amazon_demo_product y automl en GitHub. Estos cuadernos de muestra funcionan en todas las regiones sin introducir ningún parámetro y sin que el comprador necesite localizar los datos de muestra.

nota

La falta de datos de entrenamiento de muestra puede impedir que su comprador ejecute con éxito el cuaderno de Jupyter. Un cuaderno de muestra poco desarrollado podría impedir que los compradores usen su producto y dificultar su adopción.

Resumen de los requisitos y recomendaciones para los listados de productos de ML

En la siguiente tabla se proporciona un resumen de los requisitos y recomendaciones para una página de listado de productos de machine learning.

Detalles Para listados de paquetes de modelos Para listados de algoritmos
Product descriptions
Explain in detail what the product does for supported content types (for example, “detects X in images"). Required Required
Provide compelling and differentiating information about the product (avoid adjectives like "best" or unsubstantiated claims). Recommended Recommended
List most important use case(s) for this product. Required Required
Describe the data (source and size) it was trained on and list any known limitations. Required Not applicable
Describe the core framework that the model was built on. Recommended Recommended
Summarize model performance metric on validation data (for example, "XX.YY percent accuracy benchmarked using the Z dataset"). Required Not applicable
Summarize model latency and/or throughput metrics on recommended instance type. Required Not applicable
Describe the algorithm category. For example, “This decision forest regression algorithm is based on an ensemble of tree-structured classifiers that are built using the general technique of bootstrap aggregation and a random choice of features.” Not applicable Required
Usage information
For inference, provide a description of the expected input format for both the real-time endpoint and batch transform job. Include limitations, if applicable. See Requisitos de entradas y salidas. Required Required
For inference, provide input samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See Requisitos de entradas y salidas. Required Required
For inference, provide the name and description of each input parameter. Provide details about the its limitations and specify if it is required or optional. Recommended Recommended
For inference, provide details about the output data your product returns for both the real-time endpoint and batch transform job. Include any limitations, if applicable. See Requisitos de entradas y salidas. Required Required
For inference, provide output samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See Requisitos de entradas y salidas. Required Required
For inference, provide an example of using an endpoint or batch transform job. Include a code example using the AWS Command Line Interface (AWS CLI) commands or using an AWS SDK. Required Required
For inference, provide the name and description of each output parameter. Specify if it is always returned. Recommended Recommended
For training, provide details about necessary information to train the model such as minimum rows of data required. See Requisitos de entradas y salidas. Not applicable Required
For training, provide input samples hosted on GitHub. See Requisitos de entradas y salidas. Not applicable Required
For training, provide an example of performing training jobs. Describe the supported hyperparameters, their ranges, and their overall impact. Specify if the algorithm supports hyperparameter tuning, distributed training, or GPU instances. Include code example such as AWS CLI commands or using an AWS SDK, for example. Not applicable Required
Provide a Jupyter notebook hosted on GitHub demonstrating complete use of your product. See Requisitos para el cuaderno de Jupyter. Required Required
Provide technical information related to the usage of the product, including user manuals and sample data. Recommended Recommended