hadoop 词频统计

悠悠 2024-02-18 19:51 152阅读 0赞

1)先写words文件

20180425155914434 ![Image 1][]![Image 1][]

2)再将words上传到hdfs中，可以直接运行

bin/hadoop fs -put /home/data/words指定文件路径 /words目标路

20180425155945498 ![Image 1][]

20180425155955964

20180425160007973

浏览器查看文件 20180425160053355

可以单击Download下载;
必须配置: C:\Windows\System32\drivers\etc\hosts

192.168.X.X hlx

![Image 1][] 20180425160106756

2)查看案例

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar

20180425160231554

运行wordCount

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar wordcount /words文件源 /out输出路径

20180425160248820

查看节点

20180425160316238

2018042516035171

查看数据

bin/hadoop fs -ls /

2018042516040733

bin/hadoop fs -ls /out

![Image 1][] 20180425160421675

bin/hadoop fs -cat /out/part-r-00000

20180425160430393

![Image 1][]

[Image 1]:

发表评论取消回复

表情：

评论列表（有 0 条评论，152人围观）

还没有评论，来说两句吧...

相关阅读

相关 MapReduce - 词频统计

统计一个文本的词频 package Test01; import org.apache.hadoop.conf.Configuration;...

布满荆棘的人生/ 2024年04月17日 23:15/ 0 赞/ 223 阅读

相关 hadoop 词频统计

1)先写words文件 ![20180425155914434][]![Image 1][]![Image 1][] 2)再将words上传到hdfs中，可以直接运行

悠悠/ 2024年02月18日 19:51/ 0 赞/ 153 阅读

相关【Python】文本词频统计

![format_png][] 哈姆雷特英文 [https://python123.io/resources/pye/hamlet.txt][https_python123

我不是女神ヾ/ 2023年07月25日 09:19/ 0 赞/ 272 阅读

相关词频统计之《三国演义》

描述：‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪

淩亂°似流年/ 2022年11月16日 01:44/ 0 赞/ 379 阅读

相关 jieba库词频统计_运用jieba库进行词频统计

Python第三方库jieba(中文分词) 一、概述 jieba是优秀的中文分词第三方库 \- 中文文本需要通过分词获得单个的词语 \- jieba是优秀的中文分词第三

古城微笑少年丶/ 2022年11月05日 00:45/ 0 赞/ 375 阅读

相关 SpringBoot集成Hadoop系列二 ---- MapReduce词频统计

继上篇[SpringBoot集成Hadoop系列一 ---- 对HDFS的文件操作][SpringBoot_Hadoop_ ---- _HDFS]建的工程,接下来使用MapR

迷南。/ 2022年01月28日 09:13/ 0 赞/ 460 阅读

相关中文词频统计

中文词频统计 -------------------- 这个作业的要求来自于：[https://edu.cnblogs.com/campus/gzcc/GZCC-16

小鱼儿/ 2022年01月12日 13:23/ 0 赞/ 529 阅读

相关 jieba库词频统计

一、jieba 库简介 (1) jieba 库的分词原理是利用一个中文词库，将待分词的内容与分词词库进行比对，通过图结构和动态规划方法找到最大概率的词组；除此之外，ji

红太狼/ 2022年01月07日 00:43/ 0 赞/ 438 阅读

相关中文词频统计

本次作业的要求来自于：[https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2773][https_edu.cnbl

浅浅的花香味﹌/ 2021年12月20日 20:39/ 0 赞/ 450 阅读

相关中文词频统计

作业要求来自： [https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2773][https_edu.cnblogs

柔光的暖阳◎/ 2021年12月17日 08:37/ 0 赞/ 388 阅读