Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Rilascio 4.7.0 di Amazon EMR
Versioni dell'applicazione 4.7.0
Questa versione include le seguenti applicazioni: Ganglia
La seguente tabella elenca le versioni dell'applicazione disponibili in questo rilascio di Amazon EMR e quelle nei precedenti tre rilasci di Amazon EMR (quando applicabile).
Per la cronologia completa delle versioni dell'applicazione di ogni rilascio di Amazon EMR, fai riferimento ai seguenti argomenti:
| emr-4.7.0 | emr-4.6.1 | emr-4.6.0 | emr-4.5.0 | |
|---|---|---|---|---|
| AWS SDK per Java | 1.10.75 | 1,10,27 | 1,10,27 | 1,10,27 |
| Python | Non monitorato | Non monitorato | Non monitorato | Non monitorato |
| Scala | Non monitorato | Non monitorato | Non monitorato | Non monitorato |
| AmazonCloudWatchAgent | - | - | - | - |
| Delta | - | - | - | - |
| Flink | - | - | - | - |
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 |
| HBase | 1.2.1 | 1.2.0 | 1.2.0 | - |
| HCatalog | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 |
| Hadoop | 2.7.2-amzn-2 | 2.7.2-amzn-1 | 2.7.2-amzn-1 | 2.7.2-amzn-0 |
| Hive | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 |
| Hudi | - | - | - | - |
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-6 | 3.7.1-amzn-6 | 3.7.1-amzn-5 |
| Iceberg | - | - | - | - |
| JupyterEnterpriseGateway | - | - | - | - |
| JupyterHub | - | - | - | - |
| Livy | - | - | - | - |
| MXNet | - | - | - | - |
| Mahout | 0.12.0 | 0.11.1 | 0.11.1 | 0.11.1 |
| Oozie | - | - | - | - |
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 |
| Phoenix | 4.7.0- -1,2 HBase | - | - | - |
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 |
| Presto | - | - | - | - |
| Presto-Sandbox | 0.147 | 0.143 | 0.143 | 0.140 |
| Spark | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 |
| Sqoop | - | - | - | - |
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 |
| TensorFlow | - | - | - | - |
| Tez | 0.8.3 | - | - | - |
| Trino (PrestoSQL) | - | - | - | - |
| Zeppelin | - | - | - | - |
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating |
| ZooKeeper | - | - | - | - |
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | - |
note di rilascio della versione 4.7.0
Importante
Amazon EMR 4.7.0 è una versione obsoleta. Utilizza invece Amazon EMR 4.7.1 o versioni successive.
Data del rilascio: 2 giugno 2016
Funzionalità
-
Aggiunto Apache Phoenix 4.7.0
-
Aggiunto Apache Tez 0.8.3
-
Aggiornato alla versione 1.2.1 HBase
-
Aggiornato a Mahout 0.12.0
-
Aggiornato a Presto 0.147
-
Aggiornato alla versione 1.10.75 AWS SDK per Java
-
Il flag finale è stato rimosso dalla proprietà
mapreduce.cluster.local.dirinmapred-site.xmlper permettere agli utenti di eseguire Pig in modalità locale. -
Driver Amazon Redshift JDBC disponibili sul cluster
I driver JDBC Amazon Redshift sono ora inclusi in
/usr/share/aws/redshift/jdbc./usr/share/aws/redshift/jdbc/RedshiftJDBC41.jarè il driver JDBC Amazon Redshift compatibile con 4.1 e/usr/share/aws/redshift/jdbc/RedshiftJDBC4.jarè il driver JDBC Amazon Redshift compatibile con 4.0. Per ulteriori informazioni, vedere Configurazione di una connessione JDBC nella Guida alla gestione di Amazon Redshift. Java 8
A eccezione di Presto, OpenJDK 1.7 è il JDK di default utilizzato per tutte le applicazioni. Tuttavia, sia OpenJDK 1.7 sia OpenJDK 1.8 sono installati. Per informazioni su come impostare
JAVA_HOMEper le applicazioni, consulta Configurare le applicazioni per usare Java 8.
Problemi noti risolti dai rilasci precedenti
-
Risolto un problema con il kernel che influiva in modo significativo sulla performance dei volumi Throughput Optimized HDD (st1) EBS per Amazon EMR in emr-4.6.0.
-
Risolto un problema in cui un cluster restituiva un errore se una zona di cifratura HDFS veniva specificata senza scegliere Hadoop come applicazione.
-
Modificata la policy di scrittura HDFS di default da
RoundRobinaAvailableSpaceVolumeChoosingPolicy. Alcuni volumi non sono stati utilizzati correttamente con la RoundRobin configurazione, con conseguenti guasti ai core node e un HDFS inaffidabile. -
Risolto un problema con la CLI EMRFS che causava un'eccezione durante la creazione della tabella dei metadati DynamoDB di default per viste uniformi.
-
Risolto un problema di deadlock in EMRFS che accadeva eventualmente durante le operazioni multiparte di rinomina e copia.
-
È stato risolto un problema con EMRFS che causava la CopyPart dimensione predefinita di 5 MB. Il valore di default è ora di 128 MB.
-
Risolto un problema con la configurazione upstart di Zeppelin che eventualmente ti impediva di poter arrestare il servizio.
-
Risolto un problema con Spark e Zeppelin, che ti impediva di utilizzare lo schema URI
s3a://perché/usr/lib/hadoop/hadoop-aws.jarnon era caricato correttamente nel rispettivo classpath. -
Backport per HUE-2484
. -
È stato eseguito il backport di un commit
da Hue 3.9.0 (non esiste JIRA) per risolvere un problema con l'esempio del browser. HBase -
Backport per HIVE-9073
.
Versioni dei componenti 4.7.0
I componenti che Amazon EMR installa con questo rilascio sono elencati di seguito. Alcuni sono installati come parte di pacchetti di applicazione dei big data. Altri sono specifici per Amazon EMR e installati per processi e caratteristiche del sistema. Questi solitamente iniziano con emr o aws. I pacchetti di applicazione sui Big data del rilascio di Amazon EMR più recente sono di solito le versioni più recenti reperibili nella community. Mettiamo a disposizione i rilasci della community in Amazon EMR il più rapidamente possibile.
Alcuni componenti in Amazon EMR differiscono dalle versioni della community. Tali componenti hanno un'etichetta che indica la versione nel modulo . CommunityVersion-amzn-EmrVersion inizia da 0. Ad esempio, se un componente della community open source denominato EmrVersionmyapp-component con versione 2.2 è stato modificato tre volte per essere incluso in rilasci diversi di Amazon EMR, tale versione di rilascio si presenta come 2.2-amzn-2.
| Componente | Versione | Descrizione |
|---|---|---|
| emr-ddb | 3.1.0 | Connettore di Amazon DynamoDB per le applicazioni dell'ecosistema Hadoop. |
| emr-goodies | 2.0.0 | Librerie utili per l'ecosistema Hadoop. |
| emr-kinesis | 3.2.0 | Connettore di Amazon Kinesis per le applicazioni dell'ecosistema Hadoop. |
| emr-s3-dist-cp | 2.4.0 | Applicazione di copia distribuita ottimizzata per Amazon S3. |
| emrfs | 2.7.1 | Connettore di Amazon S3 per le applicazioni dell'ecosistema Hadoop. |
| ganglia-monitor | 3.7.2 | Agente Ganglia integrato per le applicazioni dell'ecosistema Hadoop con l'agente di monitoraggio Ganglia. |
| ganglia-metadata-collector | 3.7.2 | Raccoglitore di metadati Ganglia per l'aggregazione di parametri degli agenti di monitoraggio Ganglia. |
| ganglia-web | 3.7.1 | Applicazione Web per la visualizzazione di parametri raccolti dal raccoglitore di metadati Ganglia. |
| hadoop-client | 2.7.2-amzn-2 | Client di riga di comando Hadoop, ad esempio "hdfs", "hadoop" o "yarn". |
| hadoop-hdfs-datanode | 2.7.2-amzn-2 | Servizio a livello di nodo HDFS per lo storage di blocchi. |
| hadoop-hdfs-library | 2.7.2-amzn-2 | Libreria e client di riga di comando HDFS |
| hadoop-hdfs-namenode | 2.7.2-amzn-2 | Servizio HDFS per tenere traccia dei nomi di file e delle posizioni dei blocchi. |
| hadoop-httpfs-server | 2.7.2-amzn-2 | Endpoint HTTP per le operazioni HDFS. |
| hadoop-kms-server | 2.7.2-amzn-2 | Server di gestione delle chiavi crittografiche basato sull'API di Hadoop. KeyProvider |
| hadoop-mapred | 2.7.2-amzn-2 | MapReduce librerie di motori di esecuzione per l'esecuzione di un'applicazione. MapReduce |
| hadoop-yarn-nodemanager | 2.7.2-amzn-2 | Servizio YARN per la gestione di container su un singolo nodo. |
| hadoop-yarn-resourcemanager | 2.7.2-amzn-2 | Servizio YARN per l'allocazione e la gestione delle risorse di cluster e delle applicazioni distribuite. |
| hadoop-yarn-timeline-server | 2.7.2-amzn-2 | Servizio per il recupero di informazioni correnti e della cronologia per applicazioni YARN. |
| hbase-hmaster | 1.2.1 | Servizio per un HBase cluster responsabile del coordinamento delle regioni e dell'esecuzione dei comandi amministrativi. |
| hbase-region-server | 1.2.1 | Servizio per servire una o più HBase regioni. |
| hbase-client | 1.2.1 | HBase client da riga di comando. |
| hbase-rest-server | 1.2.1 | Servizio che fornisce un endpoint RESTful HTTP per. HBase |
| hbase-thrift-server | 1.2.1 | Servizio che fornisce un endpoint Thrift a. HBase |
| hcatalog-client | 1.0.0-amzn-5 | Client a riga di comando "hcat" per la manipolazione del server hcatalog. |
| hcatalog-server | 1.0.0-amzn-5 | Fornitura di servizi HCatalog, un livello di gestione delle tabelle e dello storage per applicazioni distribuite. |
| hcatalog-webhcat-server | 1.0.0-amzn-5 | Endpoint HTTP che fornisce un'interfaccia REST a HCatalog. |
| hive-client | 1.0.0-amzn-5 | Client a riga di comando Hive. |
| hive-metastore-server | 1.0.0-amzn-5 | Servizio per l'accesso al metastore Hive, un repository semantico per lo storage di metadati per SQL sulle operazioni Hadoop. |
| hive-server | 1.0.0-amzn-5 | Servizio per l'accettazione di query Hive come richieste Web. |
| hue-server | 3.7.1-amzn-7 | Applicazione Web per l'analisi di dati mediante le applicazioni dell'ecosistema Hadoop |
| mahout-client | 0.12.0 | Librerie per Machine Learning. |
| mysql-server | 5.5.46 | Server di database MySQL. |
| oozie-client | 4.2.0 | Client a riga di comando Oozie. |
| oozie-server | 4.2.0 | Servizio per l'accettazione delle richieste di flusso di lavoro Oozie. |
| phoenix-library | 4.7.0- -1,2 HBase | Le librerie Phoenix per server e client |
| phoenix-query-server | 4.7.0- -1,2 HBase | Un server leggero che fornisce accesso JDBC nonché buffer di protocollo e accesso in formato JSON all'API Avatica |
| presto-coordinator | 0.147 | Servizio per l'accettazione di query e la gestione dell'esecuzione di query di componenti presto-worker. |
| presto-worker | 0.147 | Servizio per l'esecuzione di parti di una query. |
| pig-client | 0.14.0-amzn-0 | Client a riga di comando Pig. |
| spark-client | 1.6.1 | Client a riga di comando Spark. |
| spark-history-server | 1.6.1 | Interfaccia utente Web per la visualizzazione di eventi registrati per la durata di un'applicazione Spark completata. |
| spark-on-yarn | 1.6.1 | Motore di esecuzione in memoria per YARN. |
| spark-yarn-slave | 1.6.1 | Librerie Apache Spark necessarie per gli slave YARN. |
| sqoop-client | 1.4.6 | Client a riga di comando Apache Sqoop. |
| tez-on-yarn | 0.8.3 | L'applicazione e le librerie tez YARN. |
| webserver | 2.4.18 | Server Apache HTTP. |
| zeppelin-server | 0.5.6-incubating | Notebook basato sul Web che consente l'analisi di dati interattiva. |
| zookeeper-server | 3.4.8 | Servizio centralizzato per la manutenzione delle informazioni di configurazione, i servizi di denominazione, la sincronizzazione distribuita e l'erogazione di servizi di gruppo. |
| zookeeper-client | 3.4.8 | ZooKeeper client a riga di comando. |
classificazioni di configurazione 4.7.0
Le classificazioni di configurazione consentono di personalizzare le applicazioni. Esse corrispondono spesso a un file XML di configurazione per l'applicazione, ad esempio hive-site.xml. Per ulteriori informazioni, consulta Configurazione delle applicazioni.
| Classificazioni | Descrizione |
|---|---|
capacity-scheduler | Modifica i valori nel file capacity-scheduler.xml di Hadoop. |
core-site | Modifica i valori nel file core-site.xml di Hadoop. |
emrfs-site | Modifica le impostazioni EMRFS. |
hadoop-env | Modifica i valori nell'ambiente Hadoop per tutti i componenti Hadoop. |
hadoop-log4j | Modifica i valori nel file log4j.properties di Hadoop. |
hbase-env | Modifica i valori nell'ambiente HBase. |
hbase-log4j | Modifica i valori nel file HBase hbase-log4j.properties. |
hbase-metrics | Cambia i valori nel file hadoop-metrics2-hbaase.properties. HBase |
hbase-policy | Cambia i valori nel HBase file hbase-policy.xml. |
hbase-site | Cambia i valori nel HBase file hbase-site.xml. |
hdfs-encryption-zones | Configura le zone di crittografia HDFS. |
hdfs-site | Modifica i valori nel file hdfs-site.xml di HDFS. |
hcatalog-env | Cambia i valori nell' HCatalogambiente. |
hcatalog-server-jndi | Cambia i valori in HCatalog jndi.properties. |
hcatalog-server-proto-hive-site | Cambia i valori in .xml HCatalog. proto-hive-site |
hcatalog-webhcat-env | Modifica i valori nell'ambiente HCatalog HCat Web. |
hcatalog-webhcat-log4j | Modifica i valori in HCatalog HCat log4j.properties di Web. |
hcatalog-webhcat-site | Modificare i valori nel file webhcat-site.xml di HCatalog WebHCat. |
hive-env | Modifica i valori nell'ambiente Hive. |
hive-exec-log4j | Modifica i valori nel file hive-exec-log 4j.properties di Hive. |
hive-log4j | Modifica i valori nel file hive-log4j.properties di Hive. |
hive-site | Modifica i valori nel file hive-site.xml di Hive |
hue-ini | Modifica i valori nel file ini di Hue |
httpfs-env | Modifica i valori nell'ambiente HTTPFS. |
httpfs-site | Modifica i valori nel file httpfs-site.xml di Hadoop. |
hadoop-kms-acls | Modifica i valori nel file kms-acls.xml di Hadoop. |
hadoop-kms-env | Modifica i valori nell'ambiente Hadoop KMS. |
hadoop-kms-log4j | Modifica i valori nel file kms-log4j.properties di Hadoop. |
hadoop-kms-site | Modifica i valori nel file kms-site.xml di Hadoop. |
mapred-env | Modifica i valori nell'ambiente dell'applicazione. MapReduce |
mapred-site | Modificate i valori nel file mapred-site.xml dell' MapReduce applicazione. |
oozie-env | Modifica i valori nell'ambiente di Oozie. |
oozie-log4j | Modifica i valori nel file oozie-log4j.properties di Oozie. |
oozie-site | Modifica i valori nel file oozie-site.xml di Oozie. |
phoenix-hbase-metrics | Modifica i valori nel file hadoop-metrics2-hbase.properties di Phoenix. |
phoenix-hbase-site | Modifica i valori nel file hbase-site.xml di Phoenix. |
phoenix-log4j | Modifica i valori nel file log4j.properties di Phoenix. |
phoenix-metrics | Modifica i valori nel file hadoop-metrics2-phoenix.properties di Phoenix. |
pig-properties | Modifica i valori nel file pig.properties di Pig. |
pig-log4j | Modifica i valori nel file log4j.properties di Pig. |
presto-log | Modifica i valori nel file log.properties di Presto. |
presto-config | Modifica i valori nel file config.properties di Presto. |
presto-connector-hive | Modifica i valori nel file hive.properties di Presto. |
spark | Impostazioni Amazon EMR per Apache Spark. |
spark-defaults | Modifica i valori nel file spark-defaults.conf di Spark. |
spark-env | Modifica i valori nell'ambiente Spark. |
spark-log4j | Modifica i valori nel file log4j.properties di Spark. |
spark-metrics | Modifica i valori nel file metrics.properties di Spark. |
sqoop-env | Modifica i valori nell'ambiente di Sqoop. |
sqoop-oraoop-site | Modifica i valori nel file oraoop-site.xml di OraOop Sqoop. |
sqoop-site | Modifica i valori nel file sqoop-site.xml di Sqoop. |
tez-site | Modifica i valori nel file tez-site.xml file di Tez. |
yarn-env | Modifica i valori nell'ambiente YARN. |
yarn-site | Modifica i valori nel file yarn-site.xml di YARN. |
zeppelin-env | Modifica i valori nell'ambiente Zeppelin. |
zookeeper-config | Cambia i valori nel ZooKeeper file zoo.cfg. |
zookeeper-log4j | Modifica i valori nel file ZooKeeper log4j.properties. |