Estimación del tamaño de los conjuntos de datos de SPICE

Importación de datos en SPICE

Cuando importa datos a un conjunto de datos en lugar de utilizar una consulta SQL directa, se convierten en SPICEdatos debido a la forma en que se almacenan. SPICE (Super-fast, Parallel, In-memory Calculation Engine)es el robusto motor en memoria que utiliza Amazon Quick Sight. Está diseñado para realizar cálculos avanzados y ofrecer datos de forma rápida. En Enterprise Edition, los datos almacenados en SPICE se cifran en reposo.

Al crear o editar un conjunto de datos, puede elegir entre utilizar una consulta de SPICE o una consulta directa, a menos que el conjunto de datos contenga archivos cargados. La importación (también denominada ingesta) de sus datos a SPICE puede ahorrar tiempo y dinero:

Sus consultas analíticas se procesan más rápido.
No tiene que esperar a que se procese una consulta directa.
Los datos almacenados en SPICE se pueden reutilizar varias veces sin incurrir en costos adicionales. Si utiliza un origen de datos que cobra por consulta, se le cobrará por consultar los datos cuando cree el conjunto de datos por primera vez y, más adelante, cuando lo actualice.

SPICEla capacidad se asigna por separado para cada uno Región de AWS. La SPICE capacidad predeterminada se asigna automáticamente a su hogar Región de AWS. En cada AWS cuenta, todas las personas que utilizan Quick Sight comparten la SPICE capacidad en una sola cuenta Región de AWS. Las demás no Regiones de AWS tienen SPICE capacidad a menos que decidas comprar alguna. Los administradores de Quick Sight pueden ver cuánta SPICEcapacidad tiene en cada una de ellas Región de AWS y cuánta de ella está en uso actualmente. Un administrador de Quick Sight puede adquirir más SPICE capacidad o liberar la SPICE capacidad no utilizada según sea necesario. Para obtener más información, consulte Configurar SPICE la capacidad de memoria.

Temas

Estimación del tamaño de los conjuntos de datos de SPICE

Estimación del tamaño de los conjuntos de datos de SPICE

El tamaño de un conjunto de datos en SPICE relación con la SPICE capacidad de su cuenta Quick se denomina tamaño lógico. El tamaño lógico de un conjunto de datos no es el mismo que el tamaño de la tabla o el archivo de origen del conjunto de datos. El cálculo de tamaño lógico de un conjunto de datos se produce después de haber definido todas las transformaciones de tipos de datos y las columnas calculadas durante la preparación de datos. Estos campos se materializan en SPICE de forma que se mejora el desempeño de las consultas. Los cambios que realice en un análisis no afectan al tamaño lógico de los datos en SPICE. Solo los cambios que se guardan en el conjunto de datos se aplican a la capacidad de SPICE.

El tamaño lógico de un conjunto de datos de SPICE depende de los tipos de datos de los campos del conjunto de datos y del número de filas del conjunto de datos. Los tres tipos de datos de SPICE son decimales, fechas y cadenas. Puede transformar el tipo de datos de un campo durante la fase de preparación de los datos para adaptarlo a sus necesidades de visualización de datos. Por ejemplo, el archivo que desea importar puede contener todas las cadenas (texto). Pero para que se usen de forma significativa en un análisis, prepare los datos cambiando los tipos de datos a su formato adecuado. Los campos que contienen precios se pueden cambiar de cadenas a decimales, y los campos que contienen fechas se pueden cambiar de cadenas a fechas. También puede crear campos calculados y excluir de la tabla de origen los campos que no necesite. Cuando haya terminado de preparar el conjunto de datos y se hayan completado todas las transformaciones, podrá estimar el tamaño lógico del esquema final.

nota

Los tipos de datos geoespaciales utilizan metadatos para interpretar el tipo de datos físicos. La latitud y la longitud son numéricos. Todas las demás categorías geoespaciales son cadenas.

En la siguiente fórmula, los decimales y las fechas se calculan como 8 bytes por celda con 4 bytes adicionales como auxiliares. Las cadenas se calculan en función de la longitud del texto con la codificación UTF-8 más 24 bytes con la codificación auxiliar. Los tipos de datos de cadena requieren más espacio debido a la indexación adicional que necesita SPICE para proporcionar un alto rendimiento de consulta.


Logical dataset size in bytes =
(Number of Numeric cells *  (12 bytes per cell))
+ (Number of Date cells    *  (12 bytes per cell))
+ SUM ((24 bytes + UTF-8 encoded length) per Text cell)

La fórmula anterior solo debe usarse para estimar el tamaño de un único conjunto de datos de SPICE. El uso SPICE de la capacidad es el tamaño total de todos los conjuntos de datos de una cuenta en una región específica. Quick Sight no recomienda que utilice esta fórmula para estimar la SPICE capacidad total que utiliza su cuenta de Quick Sight.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Actualización de datos

Actualización de datos en SPICE