Foro | Los últimos tutoriales de desarrollo web
 

Apache Tajo Tutorial


Apache Tajo es un marco de almacén de datos de código abierto distribuido para Hadoop. Tajo comenzó inicialmente por Gruter, una compañía de infraestructura basada en Hadoop en Corea del Sur. Más tarde, los expertos de Intel, Etsy, la NASA, Cloudera, Hortonworks también contribuyeron al proyecto. Tajo se refiere a un avestruz en idioma coreano. En el marzo del año 2014, se le concedió Tajo un proyecto de código abierto Apache de nivel superior. Este tutorial explorará los conceptos básicos de Tajo y seguir adelante, se explicará la configuración del clúster, cáscara de Tajo, consultas SQL, la integración con otras tecnologías de datos grandes y finalmente concluir con algunos ejemplos.


Audiencia

Antes de continuar con este tutorial, debe tener un buen conocimiento sobre el núcleo de Java, cualquiera del sistema operativo Linux y DBMS.


Requisitos previos

Este tutorial ha sido preparada para los profesionales que aspiran a hacer una carrera en análisis de datos grandes. Este tutorial le dará suficiente entendimiento sobre Apache Tajo.