Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Revisión de una plantilla PySpark de análisis
Cuando otro miembro crea una plantilla de análisis en su colaboración, usted debe revisarla y aprobarla antes de poder utilizarla.
El siguiente procedimiento le muestra cómo revisar una plantilla de PySpark análisis, incluidas sus reglas, parámetros y tablas a las que se hace referencia. Como miembro de la colaboración, evaluará si la plantilla se ajusta a sus acuerdos de intercambio de datos y a sus requisitos de seguridad.
Una vez aprobada la plantilla de análisis, se puede utilizar en un trabajo en AWS Clean Rooms.
nota
Cuando incorpore su código de análisis a una colaboración, tenga en cuenta lo siguiente:
-
AWS Clean Rooms no valida ni garantiza el comportamiento del código de análisis.
-
Si necesita garantizar un comportamiento determinado, revise directamente el código de su socio colaborador o póngase en contacto con un auditor externo de confianza para que lo revise.
-
-
AWS Clean Rooms garantiza que los hashes SHA-256 del código que figuran en la plantilla de PySpark análisis coincidan con el código que se ejecuta en el PySpark entorno de análisis.
-
AWS Clean Rooms no realiza ninguna auditoría ni análisis de seguridad de las bibliotecas adicionales que incorpore al entorno.
-
En el modelo de seguridad compartida:
-
Usted (el cliente) es responsable de la seguridad del código que se ejecuta en el entorno.
-
AWS Clean Rooms es responsable de la seguridad del medio ambiente y garantiza que
-
solo se ejecuta el código aprobado
-
solo se puede acceder a las tablas configuradas especificadas
-
el único destino de salida es el depósito S3 del receptor de resultados.
-
-
AWS Clean Rooms genera hashes SHA-256 del script de usuario y del entorno virtual para su revisión. Sin embargo, no se puede acceder directamente al script de usuario ni a las bibliotecas en sí. AWS Clean Rooms
Para validar que el script de usuario y las bibliotecas compartidas son los mismos que los referenciados en la plantilla de análisis, puede crear un hash SHA-256 de los archivos compartidos y compararlo con el hash de la plantilla de análisis creado por. AWS Clean Rooms Los hashes del código ejecutado también estarán en los registros de trabajos.
Requisitos previos
-
Sistema operativo Linux/Unix o subsistema Windows para Linux (WSL)
-
Archivo de script de usuario que desea aplicar un hash
-
Solicite al creador de la plantilla de análisis que comparta el archivo a través de un canal seguro.
-
-
El hash de la plantilla de análisis creado por AWS Clean Rooms
Para revisar una plantilla de PySpark análisis mediante la AWS Clean Rooms consola
-
Inicie sesión en la AWS Clean Rooms consola AWS Management Console y ábrala
con la Cuenta de AWS que funcionará como creador de colaboraciones. -
En el panel de navegación izquierdo, elija Colaboraciones.
-
Seleccione la colaboración.
-
En la pestaña Plantillas, vaya a la sección Plantillas de análisis creadas por usted.
-
Elija la plantilla de análisis cuyo estado Se puede ejecutar sea No precisa su revisión.
-
Elija Revisar.
-
Revise la Descripción general, la definición y los Parámetros de la regla de análisis (si procede).
-
Compruebe que el script de usuario compartido y las bibliotecas sean los mismos a los que se hace referencia en la plantilla de análisis.
-
Cree un hash SHA-256 de los archivos compartidos y compárelo con el hash de la plantilla de análisis creado por. AWS Clean Rooms
Para generar un hash, diríjase al directorio que contiene el archivo de script de usuario y, a continuación, ejecute el siguiente comando:
sha256sum your_script_filename.py
Ejemplo de salida:
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 my_analysis.py
-
Como alternativa, puede utilizar las funciones de suma de comprobación de Amazon S3. Para obtener más información, consulte Comprobar la integridad de los objetos en Amazon S3 en la Guía del usuario de Amazon S3.
-
Otra alternativa es ver los hashes del código ejecutado en los registros de trabajos.
-
-
Revise las tablas configuradas que se enumeran en Tablas a las que se hace referencia en la definición.
El Estado que aparece junto a cada tabla indicará Plantilla no permitida.
-
Elija una tabla.
-
Para aprobar la plantilla de análisis, elija Permitir la plantilla en la tabla. Para confirmar su aprobación, seleccione Permitir.
-
Para rechazar la aprobación, seleccione No permitir.
-
Si ha optado por aprobar la plantilla de análisis, el miembro que puede ejecutar las tareas ahora puede ejecutar una PySpark tarea en una tabla configurada mediante una plantilla de PySpark análisis. Para obtener más información, consulte Ejecutando PySpark trabajos.