Foro | Los últimos tutoriales de desarrollo web
 

HCatalog Tutorial


HCatalog es una herramienta de gestión de almacenamiento de tablas de Hadoop que expone los datos tabulares de la colmena MetaStore a otras aplicaciones de Hadoop. Permite a los usuarios con diferentes herramientas de procesamiento de datos (cerdo, MapReduce) para escribir fácilmente los datos en una rejilla. HCatalog garantiza que los usuarios no tienen que preocuparse acerca de dónde o en qué formato se almacenan sus datos. Este es un pequeño tutorial que explica lo básico de HCatalog y cómo usarlo.


Audiencia

Este tutorial está dirigido a profesionales que aspiran a hacer una carrera en Big Data Analytics mediante marco de Hadoop. desarrolladores de ETL y profesionales que están en análisis en general, así pueden utilizar este tutorial con buenos resultados.


Requisitos previos

Antes de continuar con este tutorial, es necesario un conocimiento básico de Core Java, los conceptos de base de datos de SQL, el sistema de archivos Hadoop, y cualquiera de los sabores del sistema operativo Linux.