Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Conexión a DynamoDB con Amazon EMR sin servidor
En este tutorial, cargará un subconjunto de datos de la Junta de Nombres Geográficos de los Estados Unidos a un bucket de Amazon S3 y, a continuación, utilizará Hive o Spark en
Paso 1: cargue los datos en un bucket de Amazon S3
Para crear un bucket de Amazon S3, siga las instrucciones en Crear un bucket en la Guía del usuario de la consola de Amazon Simple Storage Service. Sustituya las referencias a por el nombre del bucket recién creado. Ahora su aplicación EMR sin servidor está lista para ejecutar trabajos.amzn-s3-demo-bucket
-
Descargue el archivo de datos de ejemplo
features.zipcon el comando siguiente.wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip -
Extraiga el
features.txtarchivo del archivo y acceda a las primeras líneas del archivo:unzip features.zip head features.txtEl resultado debería tener un aspecto similar al siguiente.
1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98Los campos de cada línea indican un identificador único, nombre, tipo de característica natural, estado, latitud en grados, longitud en grados y altura en pies.
-
Descarga de datos en Amazon S3
aws s3 cp features.txt s3://amzn-s3-demo-bucket/features/
Paso 2: cree una tabla
Utilice Apache Spark o Hive para crear una nueva tabla de Hive que contenga los datos cargados en Amazon S3.
Paso 3: copie los datos a DynamoDB
Utilice Spark o Hive para copiar los datos a una nueva tabla de DynamoDB.
Paso 4: haga una consulta de datos de DynamoDB
Utilice Spark o Hive para consultar la tabla de DynamoDB.