测试集群
常见组件的最低内存配置:
zookeeper 2G
namenode 8G-12G(大概每100万个文件需要1G的内存)
datanode & MR 4G-6G
resourcemanager 2G-4G
nodemanager 2G-4G
机器数量:5-10台
机器配置:
内存:>=32G
硬盘:>=4TB
CPU:>=6core(一个物理cpu可以看成两个虚拟cpu,一个i7cpu看成两个i5cpu)
网卡和网线:>=10万兆
生产集群:
小型机群:
集群数量:<=20台
内存:>=128G
硬盘:>=20TB
CPU:>=16core
网卡和网线:>=10万兆
zookeeper:3-5个节点
中型集群:
集群数量:<=50台
内存:>=128G
硬盘:>=20TB
CPU:>=16core
网卡和网线:>=10万兆
zookeeper:5-7个节点
大型集群:
集群数量:>=50台
内存:>=128G
硬盘:>=20TB
CPU:>=16core
网卡和网线:>=10万兆
zookeeper:几十上百个节点
### hadoop发行版本
目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hortonworks版本(Hortonworks Data Platform,简称“HDP”)。对于国内而言,绝大多数选择CDH版本。
apache
cdh
hdp
为什么使用CHD而不是apache hadoop?