沉沙
2018-09-25
来源 :
阅读 1418
评论 0
摘要:本篇教程探讨了大数据技术 Hadoop MapReduce 操作 统计词频,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。
本篇教程探讨了大数据技术 Hadoop MapReduce 操作 统计词频,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。
<
1、 准备文件并设置编码格式为UTF-8并上传Linux
1)设置编码:首先打开文件点击左上角 文件(F) 点击另存为并将编码(E)设置为UTF-8 然后保存(S)替换的原来的文件
2)用工具将文件上传就Linux
3)将文件上传至HDFS
2、 新建一个Java Project
JDK必须是1.7版本以后的否则不支持
3、 导入jar
导入好多jar包并Add to Build Path
4、 编写Map()和Reduce()
5、将代码输出成jar
1) 将代码输出成jar
2) 将生成的jar上传至Linux
6、在linux中启动hdfs
1) 启动hdfs
1) 将text文件上传到HDFS
7、修改两个配置文件
在
在
(参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运MapReduce程序)
8、在linux中启动yarn
9、运行mapReduce
10、查看运行结果
本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!
喜欢 | 0
不喜欢 | 0
您输入的评论内容中包含违禁敏感词
我知道了

请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号