Fórum | tutoriais mais recente desenvolvimento web
 

Apache Pig Tutorial


Apache Pig é uma abstração sobre MapReduce. É uma ferramenta / plataforma que é utilizado para analisar grandes conjuntos de dados que representam os como fluxos de dados. Pig é geralmente usado com Hadoop; podemos executar todas as operações de manipulação de dados no Hadoop usando Pig.


Público

Este tutorial é destinado a todos os profissionais que trabalham em Hadoop que gostariam de realizar operações de MapReduce sem ter que digitar códigos complexos em Java.


Pré-requisitos

Para tirar o máximo deste tutorial, você deve ter uma boa compreensão dos princípios básicos de comandos do Hadoop e HDFS. Ele certamente vai ajudar se você é bom em SQL.