Tokenización de datos - Amazon Redshift

Tokenización de datos

La tokenización es el proceso que consiste en reemplazar valores reales con valores opacos con fines de seguridad de datos. Las aplicaciones que tienen muchos requisitos en torno a la seguridad utilizan la tokenización para reemplazar la información confidencial, como la información de identificación personal (PII) o la información de salud protegida (PHI), con tokens para reducir los riesgos de seguridad. La destokenización revierte los tokens con valores reales para los usuarios autorizados con las políticas de seguridad adecuadas.

Para la integración a servicios de tokenización de terceros, puede utilizar las funciones definidas por el usuario (UDF) de Amazon Redshift que cree con AWS Lambda. Para obtener más información, consulte Funciones de Lambda definidas por el usuario en la Guía para desarrolladores de bases de datos de Amazon Redshift. Por ejemplo, consulte Protegrity.

Amazon Redshift envía solicitudes de tokenización a un servidor de tokenización al que se accede a través de una API REST o un punto de enlace predefinido. Dos o más funciones de Lambda complementarias procesan las solicitudes de tokenización y destokenización. Para este procesamiento, puede usar las funciones de Lambda proporcionadas por un proveedor de tokenización externo. También puede utilizar las funciones de Lambda que registre como las UDF de Lambda en Amazon Redshift.

Por ejemplo, supongamos que se envía una consulta que invoca una UDF de tokenización o destokenización en una columna. El clúster de Amazon Redshift almacena las filas de argumentos aplicables y envía en paralelo esas filas a través de lotes a la función de Lambda. Las transferencias de datos entre los nodos informáticos de Amazon Redshift y Lambda se efectúan a través de una conexión de red independiente y aislada que no es accesible para los clientes. La función de Lambda transfiere los datos al punto de enlace del servidor de tokenización. El servidor de tokenización tokeniza o destokeniza los datos según sea necesario y los devuelve. A continuación, las funciones de Lambda transmiten los resultados al clúster de Amazon Redshift para continuar su procesamiento, si fuera necesario, y luego devuelven los resultados de la consulta.