Tableau incompatible lors de l'utilisation AWS Glue avec Athena sur Amazon QuickSight

Si vous rencontrez des erreurs lorsque vous utilisez AWS Glue des tables dans Athena avec Amazon QuickSight, c'est peut-être parce que certaines métadonnées sont manquantes. Suivez ces étapes pour savoir si vos tables ne possèdent pas l'TableTypeattribut QuickSight dont Amazon a besoin pour que le connecteur Athena fonctionne. Généralement, les métadonnées de ces tables n'ont pas été migrées vers le catalogue de données AWS Glue . Pour plus d'informations, consultez la section Mise à niveau vers le catalogue de AWS Glue données Step-by-Step dans le guide du AWS Glue développeur.

Si vous ne souhaitez pas migrer vers le catalogue de AWS Glue données pour le moment, deux options s'offrent à vous. Vous pouvez recréer chaque AWS Glue table via la console AWS Glue de gestion. Vous pouvez également utiliser les AWS CLI scripts répertoriés dans la procédure suivante pour identifier et mettre à jour les tables dont les TableType attributs sont manquants.

Si vous préférez utiliser l'interface de ligne de commande pour effectuer cette opération, vous pouvez utiliser la procédure suivante pour la conception de vos scripts.

Pour utiliser l'interface de ligne de commande afin de concevoir des scripts

Utilisez la CLI pour savoir quelles AWS Glue tables ne possèdent aucun TableType attribut.


aws glue get-tables --database-name <your_datebase_name>;

Par exemple, vous pouvez exécuter la commande suivante dans l'interface de ligne de commande.


aws glue get-table --database-name "test_database" --name "table_missing_table_type"

L'exemple suivant montre à quoi peut ressembler la sortie. Vous pouvez voir que la table "table_missing_table_type" ne comporte pas l'attribut TableType déclaré.


{
		"TableList": [
			{
				"Retention": 0,
				"UpdateTime": 1522368588.0,
				"PartitionKeys": [
					{
						"Name": "year",
						"Type": "string"
					},
					{
						"Name": "month",
						"Type": "string"
					},
					{
						"Name": "day",
						"Type": "string"
					}
				],
				"LastAccessTime": 1513804142.0,
				"Owner": "owner",
				"Name": "table_missing_table_type",
				"Parameters": {
					"delimiter": ",",
					"compressionType": "none",
					"skip.header.line.count": "1",
					"sizeKey": "75",
					"averageRecordSize": "7",
					"classification": "csv",
					"objectCount": "1",
					"typeOfData": "file",
					"CrawlerSchemaDeserializerVersion": "1.0",
					"CrawlerSchemaSerializerVersion": "1.0",
					"UPDATED_BY_CRAWLER": "crawl_date_table",
					"recordCount": "9",
					"columnsOrdered": "true"
				},
				"StorageDescriptor": {
					"OutputFormat": "org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat",
					"SortColumns": [],
					"StoredAsSubDirectories": false,
					"Columns": [
						{
							"Name": "col1",
							"Type": "string"
						},
						{
							"Name": "col2",
							"Type": "bigint"
						}
					],
					"Location": "s3://myAthenatest/test_dataset/",
					"NumberOfBuckets": -1,
					"Parameters": {
						"delimiter": ",",
						"compressionType": "none",
						"skip.header.line.count": "1",
						"columnsOrdered": "true",
						"sizeKey": "75",
						"averageRecordSize": "7",
						"classification": "csv",
						"objectCount": "1",
						"typeOfData": "file",
						"CrawlerSchemaDeserializerVersion": "1.0",
						"CrawlerSchemaSerializerVersion": "1.0",
						"UPDATED_BY_CRAWLER": "crawl_date_table",
						"recordCount": "9"
					},
					"Compressed": false,
					"BucketColumns": [],
					"InputFormat": "org.apache.hadoop.mapred.TextInputFormat",
					"SerdeInfo": {
						"Parameters": {
						"field.delim": ","
						},
						"SerializationLibrary": "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe"
					}
				}
			}
		]
	}

Modifiez la définition de la table dans votre éditeur pour y ajouter "TableType": "EXTERNAL_TABLE", comme illustré dans l'exemple suivant.


{
	"Table": {
		"Retention": 0,
		"TableType": "EXTERNAL_TABLE",
		"PartitionKeys": [
			{
				"Name": "year",
				"Type": "string"
			},
			{
				"Name": "month",
				"Type": "string"
			},
			{
				"Name": "day",
				"Type": "string"
			}
		],
		"UpdateTime": 1522368588.0,
		"Name": "table_missing_table_type",
		"StorageDescriptor": {
			"BucketColumns": [],
			"SortColumns": [],
			"StoredAsSubDirectories": false,
			"OutputFormat": "org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat",
			"SerdeInfo": {
				"SerializationLibrary": "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe",
				"Parameters": {
					"field.delim": ","
				}
			},
			"Parameters": {
				"classification": "csv",
				"CrawlerSchemaSerializerVersion": "1.0",
				"UPDATED_BY_CRAWLER": "crawl_date_table",
				"columnsOrdered": "true",
				"averageRecordSize": "7",
				"objectCount": "1",
				"sizeKey": "75",
				"delimiter": ",",
				"compressionType": "none",
				"recordCount": "9",
				"CrawlerSchemaDeserializerVersion": "1.0",
				"typeOfData": "file",
				"skip.header.line.count": "1"
			},
			"Columns": [
				{
					"Name": "col1",
					"Type": "string"
				},
				{
					"Name": "col2",
					"Type": "bigint"
				}
			],
			"Compressed": false,
			"InputFormat": "org.apache.hadoop.mapred.TextInputFormat",
			"NumberOfBuckets": -1,
			"Location": "s3://myAthenatest/test_date_part/"
		},
		"Owner": "owner",
		"Parameters": {
			"classification": "csv",
			"CrawlerSchemaSerializerVersion": "1.0",
			"UPDATED_BY_CRAWLER": "crawl_date_table",
			"columnsOrdered": "true",
			"averageRecordSize": "7",
			"objectCount": "1",
			"sizeKey": "75",
			"delimiter": ",",
			"compressionType": "none",
			"recordCount": "9",
			"CrawlerSchemaDeserializerVersion": "1.0",
			"typeOfData": "file",
			"skip.header.line.count": "1"
		},
		"LastAccessTime": 1513804142.0
	}
	}

Vous pouvez adapter le script suivant pour mettre à jour l'entrée sur la table, afin qu'elle comprenne l'attribut TableType.


aws glue update-table --database-name <your_datebase_name> --table-input <updated_table_input>

Vous en trouverez un exemple ci-dessous.


aws glue update-table --database-name test_database --table-input '
	{
			"Retention": 0,
			"TableType": "EXTERNAL_TABLE",
			"PartitionKeys": [
				{
					"Name": "year",
					"Type": "string"
				},
				{
					"Name": "month",
					"Type": "string"
				},
				{
					"Name": "day",
					"Type": "string"
				}
			],
			"Name": "table_missing_table_type",
			"StorageDescriptor": {
				"BucketColumns": [],
				"SortColumns": [],
				"StoredAsSubDirectories": false,
				"OutputFormat": "org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat",
				"SerdeInfo": {
					"SerializationLibrary": "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe",
					"Parameters": {
						"field.delim": ","
					}
				},
				"Parameters": {
					"classification": "csv",
					"CrawlerSchemaSerializerVersion": "1.0",
					"UPDATED_BY_CRAWLER": "crawl_date_table",
					"columnsOrdered": "true",
					"averageRecordSize": "7",
					"objectCount": "1",
					"sizeKey": "75",
					"delimiter": ",",
					"compressionType": "none",
					"recordCount": "9",
					"CrawlerSchemaDeserializerVersion": "1.0",
					"typeOfData": "file",
					"skip.header.line.count": "1"
				},
				"Columns": [
					{
						"Name": "col1",
						"Type": "string"
					},
					{
						"Name": "col2",
						"Type": "bigint"
					}
				],
				"Compressed": false,
				"InputFormat": "org.apache.hadoop.mapred.TextInputFormat",
				"NumberOfBuckets": -1,
				"Location": "s3://myAthenatest/test_date_part/"
			},
			"Owner": "owner",
			"Parameters": {
				"classification": "csv",
				"CrawlerSchemaSerializerVersion": "1.0",
				"UPDATED_BY_CRAWLER": "crawl_date_table",
				"columnsOrdered": "true",
				"averageRecordSize": "7",
				"objectCount": "1",
				"sizeKey": "75",
				"delimiter": ",",
				"compressionType": "none",
				"recordCount": "9",
				"CrawlerSchemaDeserializerVersion": "1.0",
				"typeOfData": "file",
				"skip.header.line.count": "1"
			},
			"LastAccessTime": 1513804142.0
		}'

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Compartiment intermédiaire Athena manquant

Table Athena introuvable