Fórum | tutoriais mais recente desenvolvimento web
 

Apache Tajo Tutorial


Apache Tajo é uma estrutura de armazenamento de dados open-source distribuído Hadoop. Tajo foi inicialmente começou por Gruter, uma empresa de infra-estrutura baseada em Hadoop na Coreia do Sul. Mais tarde, os especialistas da Intel, Etsy, NASA, Cloudera, Hortonworks também contribuiu para o projeto. Tajo refere-se a um avestruz no idioma coreano. No ano de março de 2014, Tajo foi concedido um projeto Apache open source de nível superior. Este tutorial vai explorar os conceitos básicos de Tajo e seguir em frente, ele vai explicar a configuração de cluster, shell Tajo, consultas SQL, integração com outras tecnologias de Big Data e, finalmente, concluir com alguns exemplos.


Público

Antes de prosseguir com este tutorial, você deve ter um bom conhecimento sobre núcleo Java, qualquer um dos Linux OS, e DBMS.


Pré-requisitos

Este tutorial foi elaborado para profissionais que aspiram a fazer uma carreira em grandes análise de dados. Este tutorial vai lhe dar conhecimento suficiente no Apache Tajo.