[转帖]Hadoop搭建以及实例演示_Hadoop,ERP及大数据讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Hadoop,ERP及大数据讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3227 | 回复: 0   主题: [转帖]Hadoop搭建以及实例演示        下一篇 
huizai
注册用户
等级:少校
经验:933
发帖:83
精华:0
注册:2013-6-18
状态:离线
发送短消息息给huizai 加好友    发送短消息息给huizai 发消息
发表于: IP:您无权察看 2013-6-24 9:29:03 | [全部帖] [楼主帖] 楼主

Hadoop搭建以及实例演示

1.下载jdk和hadoop,并解压至/opt

2.配置环境变量:gedit /etc/profile最后面添加:export PATH="$PATH:/opt/hadoop-0.20.2/bin:/opt/jdk1.7.0_21/bin"

3.配置在/opt/hadoop-0.20.2/conf下的3个文件: gedit hadoop-env.sh
 打开java环境变量: export JAVA_HOME=/opt/jdk1.7.0_21

    -------------------------------------------
  gedit hdfs-site.xml 添加:

 <property>
<name>dfs.replication</name>
<value>1</value>
</property>
--------------------------------------------


 gedit mapred-site.xml添加:

 <property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
<property>
<name>mapred.child.tmp</name>
<value>/opt/temp</value>
</property>
----------------------------------------------


4.配置完成,可以在浏览器打开http://localhost:50070和http://localhost:50030进如管理监视界面。

5.从本地拷贝文件到hadoop:hadoop fs -mkdir /temp(创建文件夹)hadoop fs -copyFromLocal /opt/a.txt /temp/即可在浏览器界面查看刚刚考入的文件。

6.演示统计字符个数程序:[root@localhost hadoop-0.20.2]# hadoop jar hadoop-0.20.2-examples.jar wordcount /achun/a.txt /tt

演示结果:

在程序临时创建的文件夹中生成结果文件,内容如下:

book  2
fuck  4
good  2
haha  2
hello  4
mask  2
master  2
yello  2
----------------------------------------------------------


 原文如下���

 hello
fuck
book
mask
yello
hello
good
fuck
master
haha
hello
fuck
book
mask
yello
hello
good
fuck
master
haha


更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论