

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Apache Pig
<a name="emr-pig"></a>

O Apache Pig é uma biblioteca Apache de código aberto que é executada sobre o Hadoop, fornecendo uma linguagem de scripts que você pode usar para transformar grandes conjuntos de dados sem precisar gravar códigos complexos em uma linguagem de computação de nível inferior, como Java. A biblioteca usa comandos semelhantes a SQL escritos em uma linguagem chamada Pig Latin e converte esses comandos em tarefas Tez com base em gráficos acíclicos direcionados () ou programas. DAGs MapReduce O Pig funciona com dados estruturados e não estruturados em vários formatos. Para obter mais informações sobre o Pig, consulte [http://pig.apache.org/](http://pig.apache.org/).

Você pode executar comandos do Pig interativamente ou no modo em lote. Para usar o Pig interativamente, crie uma conexão SSH com o nó principal e envie os comandos usando o shell do Grunt. Para usar o Pig no modo em lote, escreva os scripts do Pig, carregue-os no Amazon S3 e envie-os como etapas do cluster. Para obter mais informações sobre como enviar trabalhos para um cluster, consulte [Enviar trabalhos para um cluster](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html) no *Guia de gerenciamento do Amazon EMR*.

 Ao usar o Pig para gravar a saída em uma HCatalog tabela no Amazon S3, desative a gravação direta do Amazon EMR `mapred.output.direct.NativeS3FileSystem` definindo as propriedades e como. `mapred.output.direct.EmrFileSystem` `false` Para obter mais informações, consulte [Usando HCatalog](emr-hcatalog-using.md). Dentro de um script do Pig, você pode usar os comandos `SET mapred.output.direct.NativeS3FileSystem false` e `SET mapred.output.direct.EmrFileSystem false`.

A tabela a seguir lista a versão do Pig incluída na versão mais recente da série 7.x do Amazon EMR, além dos componentes que o Amazon EMR instala com o Pig.

Para a versão dos componentes instalados com o Pig nesta versão, consulte Versões de componentes da [versão 7.12.0](emr-7120-release.md).


**Informações sobre a versão do Pig para o emr-7.12.0**  

| Rótulo de versão do Amazon EMR | Versão do Pig | Componentes instalados com o Pig | 
| --- | --- | --- | 
| emr-7.12.0 | Pig 0.17.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-hdfs-zkfc, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn, tez-on-worker | 

A tabela a seguir lista a versão do Pig incluída na versão mais recente da série 6.x do Amazon EMR, além dos componentes que o Amazon EMR instala com o Pig.

Para obter a versão dos componentes instalados com o Pig nessa versão, consulte [Release 6.15.0 Component Versions](emr-6150-release.md).


**Informações de versão do Pig para o emr-6.15.0**  

| Rótulo de versão do Amazon EMR | Versão do Pig | Componentes instalados com o Pig | 
| --- | --- | --- | 
| emr-6.15.0 | Pig 0.17.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn, tez-on-worker | 

A tabela a seguir lista a versão do Pig incluída na versão mais recente da série 5.x do Amazon EMR, além dos componentes que o Amazon EMR instala com o Pig.

Para obter a versão dos componentes instalados com o Pig nesse lançamento, consulte [Release 5.36.2 Component Versions](emr-5362-release.md).


**Informações de versão do Pig para o emr-5.36.2**  

| Rótulo de versão do Amazon EMR | Versão do Pig | Componentes instalados com o Pig | 
| --- | --- | --- | 
| emr-5.36.2 | Pig 0.17.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, pig-client, tez-on-yarn | 

**Topics**
+ [Enviar um trabalho do Pig](emr-pig-launch.md)
+ [Chamar funções definidas pelo usuário no Pig](emr-pig-udf.md)
+ [Histórico de versões do Pig](Pig-release-history.md)