HCatalog là một công cụ quản lý lưu trữ bảng cho Hadoop đó cho thấy nhiều dữ liệu bảng của Hive metastore cho các ứng dụng Hadoop khác. Nó cho phép người sử dụng với các công cụ khác nhau xử lý dữ liệu (Pig, MapReduce) để dễ dàng ghi dữ liệu vào một mạng lưới. HCatalog đảm bảo rằng người dùng không phải lo lắng về nơi hoặc trong những định dạng dữ liệu của họ được lưu trữ. Đây là một hướng dẫn nhỏ mà giải thích chỉ những điều cơ bản của HCatalog và làm thế nào để sử dụng nó.
Hướng dẫn này được dành cho các chuyên gia tham vọng để làm cho một sự nghiệp trong Big Data Analytics sử dụng Hadoop khung. phát triển ETL và các chuyên gia người vào phân tích nói chung cũng có thể sử dụng hướng dẫn này để hiệu quả tốt.
Trước khi tiếp tục với hướng dẫn này, bạn cần có một kiến thức cơ bản của Core Java, khái niệm cơ sở dữ liệu của SQL, Hệ thống tập tin Hadoop, và bất kỳ của Linux hương vị hệ điều hành.
HCatalog is a table storage management tool for Hadoop that exposes the tabular data of Hive metastore to other Hadoop applications. It enables users with different data processing tools (Pig, MapReduce) to easily write data onto a grid. HCatalog ensures that users don’t have to worry about where or in what format their data is stored. This Learn HCatalog Full App that explains just the basics of HCatalog and how to use it.