Apache Tajo là một mã nguồn mở phân phối khung kho dữ liệu cho Hadoop. Tajo ban đầu được bắt đầu bởi Gruter, một công ty cơ sở hạ tầng Hadoop-có trụ sở tại phía nam Hàn Quốc. Sau đó, các chuyên gia của Intel, Etsy, NASA, Cloudera, Hortonworks cũng đóng góp cho dự án. Tajo đề cập đến một đà điểu trong tiếng Hàn. Trong năm tháng 3 năm 2014, Tajo đã được cấp một dự án mã nguồn mở Apache cấp cao nhất. Hướng dẫn này sẽ khám phá những điều cơ bản của Tajo và di chuyển trên, nó sẽ giải thích cài đặt cluster, Tajo vỏ, các truy vấn SQL, tích hợp với các công nghệ dữ liệu lớn khác và cuối cùng kết thúc bằng một số ví dụ.
Trước khi tiếp tục với hướng dẫn này, bạn phải có một kiến thức âm thanh trên lõi Java, bất kỳ hệ điều hành Linux, và DBMS.
Hướng dẫn này đã được chuẩn bị cho các chuyên gia tham vọng để làm cho một sự nghiệp trong phân tích dữ liệu lớn. Hướng dẫn này sẽ cung cấp cho bạn đủ hiểu biết về Apache Tajo.
In the year March 2014, Tajo was granted a top-level open source Apache project. This tutorial will explore the basics of Tajo and moving on, it will explain cluster setup, Tajo shell, SQL queries, integration with other big data technologies and finally conclude with some examples.