运行Hadoop自带的wordcount单词统计程序


0.前言
前面一篇《Hadoop初体验:快速搭建Hadoop伪分布式环境》搭建了一个Hadoop的环境,现在就使用Hadoop自带的wordcount程序来做单词统计的案例。

1.使用示例程序实现单词统计

(1)wordcount程序
wordcount程序在hadoop的share目录下,如下:
就是这个hadoop-mapreduce-examples-2.6.5.jar程序。(2)创建HDFS数据目录创建一个目录,用于保存Ma 香港云主机pReduce任务的输入文件:
创建一个目录,用于保存MapReduce任务的输出文件:
查看刚刚创建的两个目录:

(3)创建一个单词文件,并上传到HDFS创建的单词文件如下:
上传该文件到HDFS中:
在HDFS中查看刚刚上传的文件及内容:

(4)运行wordcount程序执行如下命令:

(5)查看统计结果如下:

3.参考资料
http://www.aboutyun.com/thread-7713-1-1.html

相关推荐: win10卸载内置应用怎么一键恢复

这篇文章主要介绍win10卸载内置应用怎么一键恢复,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!1、点击Cortana搜索框,输入powershell,在显示的结果中右击第一项,选择“以管理员身份运行”。2、在po 香港云主机wersh…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 07/22 21:48
下一篇 07/22 21:49

相关推荐