

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Crear una plantilla PySpark de análisis
<a name="create-pyspark-analysis-template"></a>

**nota**  
Los parámetros son cadenas proporcionadas por el usuario que pueden contener contenido arbitrario.  
Revise el código para asegurarse de que los parámetros se gestionen de forma segura y evitar comportamientos inesperados en el análisis.
Diseñe el manejo de los parámetros para que funcione de forma segura, independientemente de los valores de los parámetros que se proporcionen en el momento del envío.

**Requisitos previos**

 Antes de crear una plantilla de PySpark análisis, debe tener:
+ Ser miembro de una AWS Clean Rooms colaboración activa
+ Acceso a al menos una tabla configurada en la colaboración activa
+ Permisos para crear plantillas de análisis
+ Un script de usuario de Python y un entorno virtual creados y almacenados en S3
  + El bucket de S3 tiene activado el control de versiones. Para obtener más información, consulte [Uso del control de versiones en buckets de S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Versioning.html)
  + El bucket de S3 puede calcular las sumas de comprobación del SHA-256 para los artefactos cargados. [Para obtener más información, consulte Uso de sumas de comprobación](https://docs.aws.amazon.com/AmazonS3/latest/userguide/checking-object-integrity.html)
+ Permisos para leer el código de un bucket de S3

  Para obtener información sobre cómo crear el rol de servicio necesario, consulte[Cree un rol de servicio para leer el código de un bucket de S3 (rol de plantilla de PySpark análisis)](setting-up-roles.md#create-role-pyspark-analysis-template).

El siguiente procedimiento describe el proceso de creación de una plantilla de PySpark análisis mediante la [AWS Clean Rooms consola](https://console.aws.amazon.com/cleanrooms/home). Se supone que ya ha creado un script de usuario y archivos de entorno virtual y que ha almacenado el script de usuario y los archivos del entorno virtual en un bucket de Amazon S3.

**nota**  
El miembro que crea la plantilla de PySpark análisis también debe ser el miembro que reciba los resultados.

Para obtener información sobre cómo crear una plantilla de PySpark análisis mediante la AWS SDKs, consulte la [referencia de la AWS Clean Rooms API](https://docs.aws.amazon.com/clean-rooms/latest/apireference/Welcome.html).

**Para crear una plantilla PySpark de análisis**

1. Inicie sesión en la [AWS Clean Rooms consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/cleanrooms/home) con la Cuenta de AWS que funcionará como creador de la colaboración.

1. En el panel de navegación izquierdo, elija **Colaboraciones**.

1. Seleccione la colaboración.

1. En la pestaña **Plantillas**, vaya a la sección **Plantillas de análisis creadas por usted**.

1. Seleccione **Crear plantilla de análisis**.

1. En la página **Crear plantilla de análisis**, en **Detalles**, 

   1. Introduzca un **nombre** para la plantilla de análisis.

   1. (Opcional) Introduzca una **Descripción**.

   1. En **Formato**, elija la **PySpark**opción.

1. En **Definición**,

   1. Revise los **requisitos previos** y asegúrese de que se cumplen todos los requisitos previos antes de continuar.

   1. Para el **archivo de puntos de entrada**, introduzca el bucket de S3 o seleccione **Browse S3**.

   1. (Opcional) Para el **archivo de bibliotecas**, introduzca el depósito de S3 o seleccione **Browse S3**.

1. Para **los parámetros: opcional**, si desea añadir parámetros para que la plantilla de análisis sea reutilizable:

   1. Elija **Add parameter (Añadir parámetro)**.

   1. Introduzca un **nombre de parámetro**.

      Los nombres de los parámetros deben empezar con una letra o un guión bajo, seguidos de caracteres alfanuméricos o guiones bajos.

   1. En **Tipo**, **STRING** se selecciona automáticamente como el único tipo compatible para PySpark las plantillas de análisis.

   1. (Opcional) Introduzca un **valor predeterminado** para el parámetro.

      Si proporciona un valor predeterminado, los ejecutores de tareas pueden usar este valor al ejecutar tareas sin proporcionar explícitamente un valor de parámetro.

   1. Para añadir más parámetros, elija **Añadir otro parámetro** y repita los pasos anteriores.
**nota**  
Puede definir hasta 50 parámetros por plantilla PySpark de análisis. El valor de cada parámetro puede tener un máximo de 1000 caracteres.

1. Para **las tablas a las que se hace referencia en la definición**, 
   + Si todas las tablas a las que se hace referencia en la definición se han asociado a la colaboración:
     + Deje seleccionada la casilla de verificación **Todas las tablas a las que se hace referencia en la definición se han asociado a la colaboración**.
     + En **Tablas asociadas a la colaboración**, seleccione todas las tablas asociadas a las que se hace referencia en la definición. 
   + Si todas las tablas a las que se hace referencia en la definición no se han asociado a la colaboración:
     + Desactive la casilla de verificación **Todas las tablas a las que se hace referencia en la definición se han asociado a la colaboración**.
     + En **Tablas asociadas a la colaboración**, seleccione todas las tablas asociadas a las que se hace referencia en la definición.
     + En **Tablas que se asociarán más adelante**, introduzca un nombre de tabla. 
     + Seleccione **Mostrar otra tabla** para mostrar otra tabla.

1. Para **configurar los mensajes de error**, elija una de las siguientes opciones:
   + **Mensajes de error básicos**: devuelve los mensajes de error básicos sin exponer los datos subyacentes. Recomendado para cargas de trabajo de producción.
   + **Mensajes de error detallados: devuelve mensajes** de error detallados para una solución de problemas más rápida. Se recomienda en entornos de desarrollo y pruebas. Puede exponer datos confidenciales, incluida la información de identificación personal (PII).
**nota**  
Al utilizar **mensajes de error detallados**, todos los miembros del proveedor de datos deben aprobar esta configuración para la plantilla.

1. Especifique los permisos **de acceso al servicio** seleccionando el **nombre de un rol de servicio existente** en la lista desplegable.

   1. Si tiene permisos de listas de roles, se mostrará la lista de roles.

      Si no tiene permisos de listas de roles, puede ingresar el nombre de recurso de Amazon (ARN) del rol que desea usar.

   1. Consulte el rol de servicio mediante la elección del enlace externo **Ver en IAM**.

      Si no hay ningún rol de servicio existente, la opción **Usar un rol de servicio existente** no estará disponible.

      De forma predeterminada, AWS Clean Rooms no intenta actualizar la política de roles existente para añadir los permisos necesarios. 
**nota**  
AWS Clean Rooms requiere permisos para realizar consultas de acuerdo con las reglas de análisis. Para obtener más información sobre los permisos para AWS Clean Rooms, consulte[AWS políticas gestionadas para AWS Clean Rooms](security-iam-awsmanpol.md).
Si el rol no tiene permisos suficientes AWS Clean Rooms, recibirá un mensaje de error que indica que el rol no tiene permisos suficientes AWS Clean Rooms. Debe agregar la política de rol antes de continuar.
Si no puede modificar la política de rol, recibirá un mensaje de error que indica que AWS Clean Rooms no ha podido encontrar la política del rol de servicio.

1. Si desea habilitar la opción de **Etiquetas** para el recurso de tabla configurada, seleccione **Añadir nueva etiqueta** y, a continuación, introduzca el par de **Clave** y **Valor**.

1. Seleccione **Crear**.

1. Ahora puede informar a su miembro de la colaboración de que puede [revisar una plantilla de análisis](review-analysis-template.md). (opcional si desea consultar sus propios datos).

**importante**  
No modifique ni elimine artefactos (scripts de usuario o entornos virtuales) después de crear una plantilla de análisis.  
Si lo hace, hará lo siguiente:  
Provoca que todos los futuros trabajos de análisis que utilicen esta plantilla fallen.
Requiere la creación de una nueva plantilla de análisis con nuevos artefactos.
No afecta a los trabajos de análisis completados anteriormente.