腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Python
语
言中
的
MapReduce
来
计算
一个
单词
序列
在
文件
中
出现
的
次数
?
、
、
、
、
考虑
一个
包含由空格分隔
的
单词
的
文件
;用
Python
语言编写
一个
MapReduce
程序,该程序统计每个3个
单词
的
序列
在
文件
中
出现
的
次数
。例如,考虑以下
文件
: one two three seven one two threeseven one two 每个3个<
浏览 43
提问于2021-04-11
得票数 0
回答已采纳
6
回答
使用
词频生成“top list”
的
算法
、
、
、
我有一大堆人类创造
的
内容。我想找出
出现
频率最高
的
单词
或短语。执行此操作
的
有效方法是什么?
浏览 0
提问于2009-07-26
得票数 4
1
回答
MapReduce
-发出文档中
出现
的
前20%
的
单词
我读到过关于
MapReduce
的
文章,他们给出
的
第
一个
例子是
计算
文档
中
每个
单词
的
出现
次数
。我想知道,假设你想要获取文档中
出现
的
前20%
的
单词
,你
如何
实现呢?这似乎不太自然,因为集群
中
的
每个节点都不能看到整个
文件
,只能看到单个
单词
的
所有<e
浏览 0
提问于2013-02-28
得票数 0
回答已采纳
3
回答
Hadoop
mapreduce
是否重新处理整个数据集
、
我想知道:如果同
一个
作业提交两次,hadoop
mapreduce
是否会重新处理整个数据集?例如:
单词
计数示例
计算
输入
文件
夹
中
每个
文件
中
每个
单词
的
出现
次数
。如果我向该
文件
夹添加
一个
文件
,并重新运行word count
mapreduce
作业,初始
文件
是否会被重新读取、重新映射和重新缩减?如果是
浏览 2
提问于2011-12-27
得票数 2
回答已采纳
2
回答
使用
Map/Reduce算法
计算
字数
、
、
、
、
如果有20个
单词
要
计算
。每5个
单词
为一组,这些组由不同
的
计算
机节点处理。好吧,如果“男孩”这个词
出现
了两次,但又分成了不同
的
组,那么Map/Redude
使用
了什么样
的
算法
来
获得
单词
“男孩”
的
实际数字。
浏览 1
提问于2012-04-26
得票数 1
4
回答
计算
指定
单词
在
大型文本
文件
中
的
出现
次数
、
这是
一个
面试问题,应该关注效率。
如何
计算
指定
单词
在
大文本
文件
中
的
出现
次数
?
在
大多数编程语
言中
,我只能想到indexOf()方法,但我不认为这是正确
的
答案。
浏览 0
提问于2010-04-20
得票数 6
回答已采纳
3
回答
使用
Hadoop
MapReduce
进行排序字数统计
、
、
、
我对
MapReduce
非常陌生,我完成了
一个
Hadoop字数统计示例。
在
该示例
中
,它生成
单词
计数未排序
文件
(带有键-值对)。那么,是否可以通过将另
一个
MapReduce
任务与前
一个
任务相结合
来
按
单词
出现
的
次数
对其进行排序呢?
浏览 1
提问于2010-03-31
得票数 10
1
回答
在后台
使用
Hadoop
MapReduce
的
Bluemix上公开自己
的
服务?
、
、
、
、
我想在云上创建我自己
的
服务,其他开发人员可以访问它
来
编写他们
的
应用程序。基本上我
的
服务(API)应该在后台
使用
Apache
MapReduce
Java程序。
一个
例子:我想提供
一个
名为wordCount(String fileName)
的
服务,该服务获取
一个
文件
,
使用
Java Hadopp API
计算
单词
的
出现
浏览 0
提问于2015-08-09
得票数 0
1
回答
如何
在
Python
中
输出特殊字符?
、
、
、
我正在编写
一个
基本
的
MapReduce
程序,其中输入
文件
是纯文本,基本上程序
计算
一个
单词
在
输入中
出现
的
次数
,并且必须输出另
一个
纯文本
文件
,如下所示:第二字10 等等,其中(数字)字是
在
输入中
出现
的
单词
,而数字是它在
文件
中
出现
的
浏览 0
提问于2019-10-15
得票数 1
4
回答
MapReduce
-除了
单词
计数还有别的吗?
、
我一直
在
研究
MapReduce
,并阅读了关于它和它
的
应用
的
各种论文,但对我来说,
MapReduce
似乎只适用于最终导致
单词
计数
的
非常有限
的
场景。但如果你仔细观察,所有这些问题都可以归结为简单
的
“
计算
单词
”--即
计算
数据块
中
某物
的
出现
次数
,然后聚合/过滤和排序该
出现
列表。也有一些情况下
浏览 0
提问于2011-12-02
得票数 4
回答已采纳
2
回答
按值对地图进行排序.键
我正在编写一段代码,
计算
文件
中
每个
单词
的
出现
次数
,并按
出现
次数
的
顺序打印出这些
单词
。
在
每个
单词
之后,它会打印其
出现
的
次数
。
在
文件
中发生相同
次数
的
单词
按字母顺序排列。我不知道
如何
修改该代码以获得按
出
浏览 3
提问于2022-05-28
得票数 0
回答已采纳
1
回答
地图约简概念
、
在
MapReduce
中
映射和减少函数
使用
什么类型
的
输入和输出?这两个函数
的
输入和输出是
如何
联系
的
?
MapReduce
中
约简函数
的</e
浏览 0
提问于2018-03-30
得票数 0
回答已采纳
4
回答
需要
计算
字符串R
中
字母
序列
的
次数
、
、
、
、
所以我有
一个
核苷酸
序列
,我需要
计算
单词
gaga
出现
在
序列
中
的
次数
。到目前为止,这就是我所拥有的:N=16x2=paste(x,collapse="")下面是
一个
输出示例: gtaggcctaattataa最后,我将写
一
浏览 1
提问于2013-10-10
得票数 1
回答已采纳
2
回答
只
计算
文本
文件
Python
中
的
单词
、
、
我必须
计算
文件
中
的
所有
单词
,并创建
单词
的
直方图。我正在
使用
下面的
python
代码。if word not in histogram: else:f2是我正在读取
的
文件
我尝试
使用
多个分隔符
来
解析该
文件
,但仍然不起作用。它对
浏览 0
提问于2015-11-25
得票数 1
3
回答
csv
中
字数
的
计数及行形的确定
、
、
、
我
在
一列中有
一个
csv
文件
,如下所示。符号和数字只显示
文件
不只是包含文本。我有两个目标: 我编写了一些代码
来
尝试计数
出现
的
次数</e
浏览 2
提问于2017-07-27
得票数 0
回答已采纳
1
回答
MapReduce
Apache技术
、
、
我正在尝试
使用
MapReduce
Hadoop技术
来
统计程序。我需要做
的
是开发
一个
索引字计数应用程序,该应用程序将计数给定输入
文件
集中每个
文件
中
每个
单词
的
出现
数。此
文件
集存在于Amazon桶
中
。它还将
计算
每个
单词
的
总
出现
量。我已经附加了
计算
给定
文件
集中<em
浏览 0
提问于2015-10-02
得票数 0
回答已采纳
1
回答
如何
使用
node.js和mongoose统计文档集中
的
词频
、
、
、
我有一套MongoDB格式
的
文档。 ?
在
使用
mongoose
的
NodeJS
中
,我想
计算
每个
单词
出现
的
次数
。结果应该是这样
的
: [ "sprint": 2, "laugh": 1,
浏览 42
提问于2019-09-27
得票数 0
回答已采纳
2
回答
单词
在
List -
Python
中
出现
的
次数
是多少次?
、
、
、
我有
一个
单词
列表。我想出了
如何
计算
每个
单词
的
数量。现在我想知道,在这个列表中
出现
了多少个
单词
,多少次(?)。输出应该如下所示:6.000字第二次.mouse", "time", "time"]3 Word occurred 1 time1 Word occurred 3 time 我希望我
的
意图是清楚<e
浏览 7
提问于2022-06-21
得票数 0
1
回答
MapReduce
中
的
最大值是
如何
获取
的
,它们代表什么?
、
我正在尝试了解
MapReduce
在后端是
如何
工作
的
。这段代码给了我
出现
次数
最多
的
单词
,它是我
的
数据集中
的
' the‘。最大值是
如何
工作
的
,它代表什么?
浏览 0
提问于2014-03-12
得票数 0
3
回答
Python
搜索文本
文件
并
计算
指定字符串
的
出现
次数
、
、
我正在尝试
使用
python
搜索文本
文件
,并
计算
用户定义
的
单词
出现
的
次数
。但是,当我运行下面的代码,而不是获得唯一
单词
在
文件
中
出现
的
次数
总和时,我得到
的
是该
文件
中
包含该
单词
的
行数
的
计数。示例:
单词
'
浏览 2
提问于2016-10-16
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券