腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
字符串
中
变量
的
聚合
数据
和
频率
列表
、
我有以下
数据
表3: A c 15: B
浏览 13
提问于2018-02-21
得票数 0
回答已采纳
2
回答
对于字母表
中
的
每个字母,创建一个
变量
来存储
字符串
中
每个字母
的
频率
,并为其赋值为零。
创建一个
变量
来存储给定
的
字符串
“您可以拥有没有信息
的
数据
,但是没有
数据
就不能拥有信息”。将给定
的
字符串
转换为小写,创建一个包含每个英文字母小写字母
的
列表
对于字母表
列表
中
的
每个字母:创建一个
变量
来存储
字符串
中
每个字母
的
频率
,并为给定
字符串
中
浏览 13
提问于2022-09-25
得票数 0
0
回答
我怎样才能使我
的
代码在R
中
更有效率-它是重复性
的
、
、
我有一个关于我
的
代码效率
的
问题。我
的
环境中有9个
数据
帧,对于每个
数据
帧,我都需要执行相同
的
步骤。步骤
和
代码如下(仅对其中两个
数据
帧显示):wordcloud(words,对它们
的
频率
求和,然后基于
聚合
的
结果创建一个世界云。环境
中</em
浏览 7
提问于2017-12-04
得票数 1
回答已采纳
3
回答
字母
频率
- Python
我有以下一套指示:对于字母表
中
的
每一个字母: 创建一个
变量
来存储
字符串
中
每个字母
的
频率
,并将初始值设为零。对于给定
字符串
浏览 6
提问于2022-10-08
得票数 1
2
回答
根据R
中
rest
的
惟一性
聚合
一列
、
、
我希望根据其余列
的
惟一性来
聚合
freq列。我通常用但是在这种情况下,
变量
将是未知
的
,因为用户将使用闪亮
的
下拉
列表
来选择
变量
。2014 56Chlamydia F 32 AA 1/3/2014 52 因此,在我
的
例
浏览 0
提问于2018-05-16
得票数 1
回答已采纳
1
回答
在R中使用hclust进行加权观测
频率
聚类
、
、
、
为了克服这个问题,我选择
聚合
我
的
矩阵来合并那些相同
的
观察值,从而将我
的
矩阵减少到大约10K个观察值。我有这个
聚合
矩阵
中
每一行
的
频率
。我现在需要将此
频率
作为权重合并到我
的
分层聚类
中
。这些
数据
是500K观察值
的
数值
和
分类
变量
的
混合,因此我使用了daisy包来计算我
的
聚合
数
浏览 15
提问于2017-07-25
得票数 1
1
回答
R中文本
数据
中
两对组合
的
出现
频率
、
、
、
我有一个包含几个
字符串
(文本)
变量
的
文件,每个应答者都为每个
变量
写了一两句句子。我希望能够找到每个词组合
的
频率
(即“能力”
和
“性能”
的
频率
)。(data.words.list) data.freq.list <- table(data.words.vector) 这给出了每个单词
的
列表
,以及它在
字符串
变量<
浏览 4
提问于2013-09-18
得票数 0
回答已采纳
1
回答
为什么在SPSS中汇总前后
的
总和是不同
的
?
我有一个以ID作为第一列
的
大型
数据
库。第二个
变量
,EventName,是时间序列。因此ID将在每个时间序列
中
重叠。下列
变量
识别每个唯一ID
的
主
变量
和
重复项。下面的
变量
是每个时间段
的
MH诊断(0=no;1=yes)。TypeMH上升到25。下面示例
中
的
最后一个
变量
是所有MHTypes 1-25
的
1s之和。当我为每个MH类型在整个
数据</em
浏览 0
提问于2019-09-06
得票数 1
回答已采纳
2
回答
如何将带有逗号分隔项
的
字符串
聚合
到带有Pandas ()
的
列表
中
?
、
、
、
我有如下
数据
:joseph fr 14,它捕获名称
变量
的
所有三个字母子
字符串
。我希望将其
聚合
到一个
列表
中
,并将每个逗号分隔
的
项按每一行附加到
列表
中
,并将其视为一个
列表
项。"ann,anne“在最终
列表
中被认为是一个单一
浏览 4
提问于2019-11-07
得票数 5
回答已采纳
2
回答
创建一个新
变量
,将两年
的
观测结果汇总在一起
我想用x随时间
的
频率
来绘制一些
数据
,以年份为单位。我已经能够将
数据
操作成一个
数据
框架,在这个框架
中
,我拥有某些二进制
字符串
数据
的
频率
。按照目前
的
情况,我按年计算
频率
,每年有两行,以便绘制不同二进制结果
的
频率
。不过,我想按年列出这些意见总数
的
百分比。"no", "yes", "no
浏览 4
提问于2013-09-13
得票数 0
回答已采纳
3
回答
Web 3- ASP.NET应用程序-高效地
聚合
数据
、
我正在运行一个ASP.NET MVC 3 web应用程序,并希望收集统计
数据
,例如:我想汇总这些
数据
并将其细分如下:我想知道
聚合
数据
的
最干净
和
最有效
的
策略是什么。我能想到一对夫妇,但我
浏览 10
提问于2011-09-19
得票数 2
1
回答
如何在SPSS
中
迭代
和
增加计数器?
、
、
我想在我
的
SPSS
数据
集中计算教育进步。我有一些编程经验,但我被语法卡住了。 我有一个
变量
my_education。我想迭代地将my_education与education_father
和
education_mother进行比较。如果my_education比我父母
的
大,我就有进步,如果没有,那就不是进步。所有
变量
都是用数字编码
的
。我想主要
的
问题是如何使用代码来迭代整个
数据
集,并在最后增加计数器。有人能帮我吗?但仍有许多案例没有统计,
浏览 29
提问于2019-02-18
得票数 0
1
回答
如何使用哈希码作为其值设置索引列?
、
、
、
我正在尝试使用具有分类值(
字符串
值)
的
数据
集来训练机器学习模型。然而,火花模型不能使用
字符串
值进行训练,因此我必须将它们转换或将它们索引为一个数值。然而,我发现Spark
的
唯一
字符串
转换器是StringIndexer,但是我发现这是非常不可靠
的
,因为它根据
字符串
的
频率
对string进行索引,并且不能保证在我
的
测试文件
中
字符串
值
的
频率</e
浏览 1
提问于2017-07-31
得票数 1
回答已采纳
1
回答
建立多个子表
数据
库模型
的
最佳方法
、
、
、
我所拥有的:一个带有的Postgres
数据
库。 模型是什么:一个主要实体Event
和
许多子继承(10+)。每个孩子都有不同
的
属性。如何使用它:模型将按时间顺序查询所有
聚合
事件
的
列表
,然后按其“类型”进行筛选,以便显示(Parameter,Symptom,.)。这意味着我想要一个具有最近20个list
的
子集
的
Event(例如)。对于这20个
数据
中
的
每一个,我将从表
中
获取每个单独<em
浏览 2
提问于2020-10-20
得票数 0
1
回答
基于R
中
另一个
变量
中
的
不同
字符串
,统计
字符串
(组合在多个
变量
中
)
的
频率
我目前正在处理R
中
的
国家/地区
数据
。当我希望将所有国家/地区
变量
一起计数时,为了计算整个
数据
帧中国家/地区
变量
的
组合
频率
,我使用: combinedfreq <- data.frame(table(unlist(dataset[c("Country1国家
字符串
是相互排斥
的
,因此在每个观察值
中
,相同
的
字符串
不能重复,并且
浏览 0
提问于2018-10-08
得票数 0
1
回答
非孤立词
的
文本挖掘
、
、
我没有要查找
的
特定单词
列表
(在本例
中
,我将使用grep() )。我没有文本挖掘方面的经验,但经过一些研究后,我发现大多数文本挖掘工具(例如(tm) )都需要分离单词(“蜂蜜是甜
的
”),以便能够对它们进行
聚合
和
分析。所以我想我要找
的
是一个用蛮力比较
字符串
的
工具。例如,查找所有超过3个字符
的
相似
字符串
(在
频率
表
中
以"n“为特征。 我
的
假设正
浏览 3
提问于2017-10-24
得票数 2
回答已采纳
1
回答
如何在Pandas
中
绘制带有预
聚合
数据
的
直方图?
、
、
、
、
你能帮我找出如何用预
聚合
数据
绘制直方图吗?我
的
意思是,我已经将
数据
分组到存储箱
中
,以便从SQL Server加载它们并保存到xls文件。现在我有两个
变量
:
频率
和
bin
变量
(价格)。例如,我有一个0- 10美元
的
价格箱。这里有120个实例。然后我有10 - 20美元
的
价格箱,里面有500个实例,等等。 问题是我有太多
的
预
聚合
箱。因为价格在0到50000之间变化,步长
浏览 0
提问于2016-03-16
得票数 3
1
回答
Solr -按组分列
的
合计术语
频率
、
、
假设我在Solr (最新
的
)
中
爬行
和
索引了以下一组分组网站: "id":"1", 1
和
2是不同
浏览 2
提问于2013-07-28
得票数 1
1
回答
使用Haskell进行无监督聚类
、
、
、
、
我正在尝试开发一种算法,它可以报告相似模式在
数据
集之间出现
的
频率
和
贴近度。简单
的
例子:set2 = [1, 2, 3, 0, 0, 0, 0, 0, 0]这些集合
中
的
每一个都有1、2
和
3,但这些数字在set2
和
set3
中
更接近。我怀疑我可以通过
列表
理解来完成
浏览 0
提问于2012-05-05
得票数 2
回答已采纳
1
回答
如何在不按总和
聚合
的
情况下进行排序(Google Data Studio)?
我使用一个简单
的
CSV文件作为
数据
源,反过来在Google data Studio
中
显示表
中
的
数据
。我想有一个默认
的
显示已经排序
的
变量
(Commission),其中有一个数值。当我向Google Data Studio
的
维
列表
中
添加Commission
和
其他各种
变量
,然后尝试将Commission指定为
变量
作为主排序时,默认情况
浏览 34
提问于2020-04-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券