Importación de datos en SPICE
Cuando importa datos a un conjunto de datos en lugar de utilizar una consulta SQL directa, se convierten en datos de SPICE debido a la forma en que se almacenan. SPICE (Super-fast, Parallel, In-memory Calculation Engine) es el robusto motor en memoria que utiliza Amazon QuickSight. Está diseñado para realizar cálculos avanzados y ofrecer datos de forma rápida. En Enterprise Edition, los datos almacenados en SPICE se cifran en reposo.
Al crear o editar un conjunto de datos, puede elegir entre utilizar una consulta de SPICE o una consulta directa, a menos que el conjunto de datos contenga archivos cargados. La importación (también denominada ingesta) de sus datos a SPICE puede ahorrar tiempo y dinero:
- 
				
Sus consultas analíticas se procesan más rápido.
 - 
				
No tiene que esperar a que se procese una consulta directa.
 - 
				
Los datos almacenados en SPICE se pueden reutilizar varias veces sin incurrir en costos adicionales. Si utiliza un origen de datos que cobra por consulta, se le cobrará por consultar los datos cuando cree el conjunto de datos por primera vez y, más adelante, cuando lo actualice.
 
La capacidad de SPICE se asigna por separado para cada Región de AWS. La capacidad de SPICE predeterminada se asigna automáticamente a su Región de AWS. Para cada cuenta de AWS, todas las personas que utilizan QuickSight comparten la capacidad de SPICE en una sola Región de AWS. El resto de Regiones de AWS no tienen capacidad de SPICE, a menos que decida comprarla. Los administradores de QuickSight pueden ver cuánta capacidad de SPICE tiene en cada Región de AWS y cuánta está en uso actualmente. Un administrador de QuickSight puede adquirir más capacidad de SPICE o liberar la capacidad de SPICE no utilizada según sea necesario. Para obtener más información, consulte Administración de la capacidad de memoria de SPICE.
Estimación del tamaño de los conjuntos de datos de SPICE
El tamaño de un conjunto de datos en SPICE en relación con la capacidad de SPICE de su cuenta se denomina tamaño lógico. El tamaño lógico de un conjunto de datos no es el mismo que el tamaño de la tabla o el archivo de origen del conjunto de datos. El cálculo de tamaño lógico de un conjunto de datos se produce después de haber definido todas las transformaciones de tipos de datos y las columnas calculadas durante la preparación de datos. Estos campos se materializan en SPICE de forma que se mejora el desempeño de las consultas. Los cambios que realice en un análisis no afectan al tamaño lógico de los datos en SPICE. Solo los cambios que se guardan en el conjunto de datos se aplican a la capacidad de SPICE.
El tamaño lógico de un conjunto de datos de SPICE depende de los tipos de datos de los campos del conjunto de datos y del número de filas del conjunto de datos. Los tres tipos de datos de SPICE son decimales, fechas y cadenas. Puede transformar el tipo de datos de un campo durante la fase de preparación de los datos para adaptarlo a sus necesidades de visualización de datos. Por ejemplo, el archivo que desea importar puede contener todas las cadenas (texto). Pero para que se usen de forma significativa en un análisis, prepare los datos cambiando los tipos de datos a su formato adecuado. Los campos que contienen precios se pueden cambiar de cadenas a decimales, y los campos que contienen fechas se pueden cambiar de cadenas a fechas. También puede crear campos calculados y excluir de la tabla de origen los campos que no necesite. Cuando haya terminado de preparar el conjunto de datos y se hayan completado todas las transformaciones, podrá estimar el tamaño lógico del esquema final.
nota
Los tipos de datos geoespaciales utilizan metadatos para interpretar el tipo de datos físicos. La latitud y la longitud son numéricos. Todas las demás categorías geoespaciales son cadenas.
En la siguiente fórmula, los decimales y las fechas se calculan como 8 bytes por celda con 4 bytes adicionales como auxiliares. Las cadenas se calculan en función de la longitud del texto con la codificación UTF-8 más 24 bytes con la codificación auxiliar. Los tipos de datos de cadena requieren más espacio debido a la indexación adicional que necesita SPICE para proporcionar un alto rendimiento de consulta.
Logical dataset size in bytes = (Number of Numeric cells * (12 bytes per cell)) + (Number of Date cells * (12 bytes per cell)) + SUM ((24 bytes + UTF-8 encoded length) per Text cell)
La fórmula anterior solo debe usarse para estimar el tamaño de un único conjunto de datos de SPICE. El uso de la capacidad de SPICE es el tamaño total de todos los conjuntos de datos de una cuenta de una región específica. No se recomienda usar esta fórmula para estimar la capacidad total de SPICE que usa la cuenta.