[转帖]Hadoop 版本说明_Hadoop,ERP及大数据讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Hadoop,ERP及大数据讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3250 | 回复: 0   主题: [转帖]Hadoop 版本说明        下一篇 
huizai
注册用户
等级:少校
经验:933
发帖:83
精华:0
注册:2013-6-18
状态:离线
发送短消息息给huizai 加好友    发送短消息息给huizai 发消息
发表于: IP:您无权察看 2013-6-19 14:55:52 | [全部帖] [楼主帖] 楼主

转自:http://my.oschina.net/zgqhope/blog/125765

最近想研究一下hadoop,增加自己的知识点,但是从官网准备下载时却发现,版本太多了,而且从版本号上面完全看不出因果关联,经过多方查询并从董的博客(dongxicheng)学到了一下内容,以便大家参考。

同时董的博客:http://dongxicheng.org/mapreduce-nextgen/how-to-select-hadoop-versions/

1)Apache Hadoop版本有2代,Hadoop 1.0 (0.20.x,0.21.x,0.22.x) 和Hadoop 2.0。其中0.20.x最后演化成1.0.x,成了稳定版。而0.21.x和0.22.x则增加了NameNode HA等新的重大特性。第二代Hadoop包含0.23.x和2.x,它们是完全不同于第一代的全新架构,均包含HDFS和YARN两个系统,2.x又比0.23.x增加了NameNode HA和wire-compatibility两个重大特性。

2)如何选择Hadoop版本?当前版本比较混乱,让初学者不知所措。实际上,当前Hadoop只有两个版本:Hadoop 1.0 和Hadoop 2.0。其中Hadoop 1.0由一个分布式文件系统HDFS和一个离线计算框架MapReduce组成。而Hadoop 2.0则包含一个支持NameNode横向扩展的HDFS,一个资源管理系统YARN和一个运行在YARN上的离线计算框架MapReduce。

这样看的话,2.0功能更强大。但是2.0目前尚不稳定。

目前稳定版本中,Apache的有Hadoop 1.1.2(截止2013.4.26)




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论