Solución de errores de filas omitidas - Amazon Quick Suite

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de errores de filas omitidas

Al importar datos, Amazon Quick Sight previsualiza una parte de los datos. Si no puede interpretar una fila por algún motivo, Quick Sight la omite. En algunos casos, la importación fallará. Cuando esto ocurre, Quick Sight devuelve un mensaje de error que explica el error.

Afortunadamente, hay un número limitado de cosas que pueden salir mal. Algunos problemas se pueden evitar si se tienen en cuenta ejemplos como los siguientes:

  • Asegúrese de que no haya incoherencias entre el tipo de datos de campo y los datos de campo, por ejemplo, datos de cadena ocasionales en un campo con un tipo de datos numéricos. Estos son algunos ejemplos que pueden resultar difíciles de detectar al escanear el contenido de una tabla:

    • '': usar una cadena vacía para indicar un valor que falta

    • 'NULL': usar la palabra “nulo” para indicar un valor que falta

    • $1000: incluir un signo de dólar en el valor de una divisa lo convierte en una cadena

    • 'O'Brien': usar la puntuación para marcar una cadena que a su vez contiene la misma puntuación.

    Sin embargo, este tipo de error no siempre es tan fácil de encontrar, especialmente si tiene muchos datos o si los escribe a mano. Por ejemplo, algunas aplicaciones de ventas o de servicio al cliente implican introducir información proporcionada verbalmente por los clientes. Es posible que la persona que escribió originalmente los datos los haya colocado en el campo incorrecto. Es posible que añada, u olvide añadir, un carácter o un dígito. Por ejemplo, podría introducir la fecha “0/10/12020” o introducir el género de una persona en un campo destinado a la edad.

  • Asegúrese de que el archivo importado se procesa correctamente con o sin encabezado. Si hay una fila de encabezado, asegúrese de elegir la opción de subida Contiene encabezado.

  • Asegúrese de que los datos no superen uno o más de los Cuotas de origen de datos.

  • Asegúrese de que los datos sean compatibles con los Tipos de datos y valores admitidos.

  • Asegúrese de que los campos calculados contienen datos que funcionan con el cálculo, en lugar de ser incompatibles con la función del campo calculado o excluidos por ella. Por ejemplo, si tiene un campo calculado en su conjunto de datos que utilizaparseDate, Quick Sight omite las filas en las que ese campo no contiene una fecha válida.

Quick Sight proporciona una lista detallada de los errores que se producen cuando el SPICE motor intenta ingerir datos. Cuando un conjunto de datos guardado informa de filas omitidas, puede ver los errores para tomar medidas y solucionar los problemas.

Visualización de los errores de las filas que se omitieron durante la ingesta de SPICE (importación de datos)
  1. Seleccione Datos a la izquierda. En la pestaña Conjuntos de datos, elija el conjunto de datos problemático para abrirlo.

  2. En la página de detalles del conjunto de datos que se abre, seleccione la pestaña Actualizar.

    El historial de ingesta de SPICE se muestra en la parte inferior.

  3. Para la ingesta con el error, seleccione Ver resumen de errores. Este enlace se encuentra en la columna Estado.

  4. Examine el registro de importación de archivos que se abre. Muestra las siguientes secciones:

    • Resumen: proporciona una puntuación porcentual del número de filas que se omitieron del número total de filas en la importación. Por ejemplo, si se omiten 864 filas de un total de 1728, la puntuación es del 50,00 %.

    • Filas omitidas: proporciona el recuento de filas, el nombre del campo y el mensaje de error de cada conjunto de filas omitidas similares.

    • Solución de problemas: proporciona un enlace para descargar un archivo que contiene información de error.

  5. En Solución de problemas, seleccione Descargar el archivo de filas de error.

    El archivo de errores tiene una fila para cada error. El archivo se denomina error-report_123_fe8.csv, y 123_fe8 se reemplaza por una cadena de identificación única. El archivo contiene las siguientes columnas:

    • ERROR_TYPE: el tipo o el código de error del error que se produjo al importar esta fila. Puede buscar este error en la sección Códigos de error de ingesta de SPICE que sigue a este procedimiento.

    • COLUMN_NAME: el nombre de la columna en sus datos que provocó el error.

    • Todas las columnas de la fila importada: las columnas restantes duplican toda la fila de datos. Si una fila tiene más de un error, puede aparecer varias veces en este archivo.

  6. Seleccione Editar conjunto de datos para realizar cambios en su conjunto de datos. Puede filtrar los datos, omitir campos, cambiar los tipos de datos, ajustar los campos calculados existentes y añadir campos calculados que validen los datos.

  7. Una vez que haya realizado los cambios indicados por los códigos de error, vuelva a importar los datos. Si aparecen más errores de ingesta de SPICE en el registro, repita este procedimiento para corregir todos los errores restantes.

sugerencia

Si no puede resolver los problemas con los datos en un periodo de tiempo razonable mediante el editor de conjuntos de datos, consulte a los administradores o desarrolladores propietarios de los datos. A largo plazo, resulta más rentable limpiar los datos más cerca de su origen, en lugar de añadir un procesamiento de excepciones mientras se preparan los datos para su análisis. Al corregirlo en el origen, se evita una situación en la que varias personas corrijan los errores de diferentes maneras, lo que se traduce en resultados de informes diferentes más adelante.

Práctica de la solución de problemas de filas omitidas
  1. Descargue CSV files for troubleshooting skipped rows.zip.

  2. Extraiga los archivos a una carpeta que pueda usar para cargar el archivo.csv de muestra en Quick Sight.

    El archivo zip contiene los dos siguientes archivos de texto:

    • sample dataset - data ingestion error.csv: un ejemplo de archivo .csv que contiene problemas que provocan la omisión de filas. Puede intentar importar el archivo usted mismo para ver cómo funciona el proceso de error.

    • sample data ingestion error file— Un archivo de error de muestra generado durante la SPICE ingesta al importar el archivo.csv de muestra a Quick Sight.

  3. Siga estos pasos para importar los datos:

    1. Seleccione Datos, pestaña Conjuntos de datos, Nuevo, Conjunto de datos.

    2. Elija Cargar un archivo.

    3. Busque y elija el archivo denominado sample dataset - data ingestion error.csv.

    4. Seleccione Cargar un archivo, Edite la configuración y prepare los datos.

    5. Seleccione Guardar para salir.

  4. Elija su conjunto de datos para ver su información y, a continuación, seleccione Ver resumen de errores. Examine los errores y los datos para ayudarle a resolver los problemas.