Hadoop核心概念
阅读原文时间:2023年09月07日阅读:2

大数据开发总体架构:

Hadoop是大数据开发所使用的一个核心框架。使用Hadoop可以方便的管理分布式集群,将海量数据分布式的存储在集群中,并使用分布式并行程序来处理这些数据。

Hadoop由许多子系统组成,如下图:

Hadoop1.x与2.x的对比:

YARN:管理集群资源(内存、CPU)