腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Numpy
,
观察
值
中
变量
对
的
频率
python
、
arrays
、
numpy
我有一个MxN 2dnumpy数组"A",其中M是
观察
值
的
数量,N是要检查
的
变量
的
数量。 A
中
的
每个条目可以是1或0,1表示该
观察
中
存在该
变量
,而0表示不存在该
变量
。我想创建一个相互
频率
的
NxN矩阵,"B",根据
变量
的
存在。"B“
中
的<
浏览 13
提问于2019-06-28
得票数 1
回答已采纳
1
回答
在SAS
中
,如何创建一定数量
的
记录,其中主要结果不会基于另一个
变量
的
值
出现?
sas
、
categorical-data
我正在研究传球和跑动
对
几个足球赛季伤病
的
影响。通过收集数据
的
方式,所有的受伤都被记录下来,以及关于受伤发生
的
比赛
的
信息(即位置,季度,比赛类型),比赛信息(例如天气条件,比赛场地等),以及团队信息(即比赛
中
传球与跑动
的
次数)。对于一支球队来说,在一场比赛中有从0到大约6-7次受伤
的
范围,并且总
的
传球和跑动比赛都会被记录下来,所以我需要找到一种方法来添加X(总传球次数减去传球比赛
中
的
受伤次数)和Y(总
浏览 0
提问于2020-07-27
得票数 0
3
回答
具有已知
变量
级别的count_values
python
、
pandas
我正在寻找一种计算pivot_tables和
频率
计数
的
有效方法,但我
的
要求是,如果我知道
变量
的
域,那么应该
对
域中
的
每个
值
进行计数,而不仅仅是那些在样本中
观察
到
的
值
。例如,在下面的代码
中
,Series.count_values方法输出:1 20 02
浏览 3
提问于2016-05-13
得票数 1
回答已采纳
2
回答
R
中
的
二元
变量
组合分析
r
、
dataframe
、
binary
、
combinations
、
frequency
我有一个数据集,其中有很多二进制
变量
。为了便于说明,这里是一个较小
的
版本,只有4个
变量
: set.seed(5) "Meditated"=sample(c(0,1),10,TRUE)) 在上面的代码
中
,每一行都对应于一个
观察</
浏览 22
提问于2021-10-11
得票数 0
回答已采纳
1
回答
基于R
中
另一个
变量
中
的
不同字符串,统计字符串(组合在多个
变量
中
)
的
频率
r
当我希望将所有国家/地区
变量
一起计数时,为了计算整个数据帧中国家/地区
变量
的
组合
频率
,我使用: combinedfreq <- data.frame(table(unlist(dataset[c("Country1give将组合所有4个
变量
的
频率
,从而得到单个
频率
计数。国家字符串是相互排斥
的
,因此在每个
观察
值
中
,相同
的
字符串不能
浏览 0
提问于2018-10-08
得票数 0
1
回答
我希望在mutate()函数中使用以前创建
的
函数。但R似乎不想让我
r
、
dataframe
、
mutate
我正在查看人口数据,并希望确保我有足够
的
观察
做县级分析。因此,我想要生成一个
变量
,为"county“行分配具有相同
值
的
每个
观察
的
数目。我希望为我
的
数据框架("cps")
中
的
每一行分配一个新
变量
("freq"),它表示它在一个特定
变量
("county")
中
的
特定
值</em
浏览 0
提问于2022-11-17
得票数 2
回答已采纳
1
回答
表包(R)
r
嗨,我正在做一个表,它显示连续
变量
(x)跨子组
的
平均值。大多数表一包用于
频率
表,并将我
的
变量
x作为分类
值
,并在表
中
填写给定x
值
在每个子组
中
的
观察
频率
。任何关于桌子包装
的
建议,都能满足我
的
需要。
浏览 4
提问于2022-03-09
得票数 0
回答已采纳
1
回答
探索
变量
以指导xgboost调优
visualization
、
xgboost
、
hyperparameter-tuning
简而言之:在为xgboost选择参数值时,如何考虑
变量
的
类型和分布?示例:具有二进制结果
变量
和二进制/连续预测器混合
的
数据集。结果
变量
(每次
观察
一个
值
):一组名为味道(~150个
浏览 0
提问于2020-10-09
得票数 4
回答已采纳
1
回答
如何用进度表来衡量百分比?
sas
我正在使用proc tabulate创建一组
频率
表,我必须根据数据集中每个person
的
年龄
的
一组权重来权衡百分比。我
的
问题是,重量似乎
对
我
的
结果有任何影响。我知道,我可以用proc来完成这个任务,但是我
的
表非常详细,因此我使用proc表格。我包括了一个数据集
的
示例,以及到目前为止我尝试过
的
内容:input gender wgt q1 year;0 1.5 0 2014 0 1
浏览 2
提问于2018-11-14
得票数 0
回答已采纳
2
回答
表格命令Stata
frequency
、
stata
我不知道Stata是否能做到这一点,但我经常使用tabulate命令来查找
频率
。例如,我有一个成功
变量
,它
的
值
为0到1,我想知道某一组
观察
(即tab success if group==1 )
的
成功率。我想知道我是否可以做这个操作
的
相反部分。也就是说,我想知道是否可以找到一个
频率
大于或等于15%
的
“组”
值
。作为一个例子gen success=mpg&
浏览 3
提问于2014-02-15
得票数 0
回答已采纳
2
回答
如何使用Math.net计算拟合优度?
.net
、
statistics
、
chi-squared
、
math.net
比方说,我有一个骰子,它产生6
的
可能性是1
的
19倍,因为它被篡改了。当我把这个骰子掷60次时,六种可能结果
的
预期
频率
与
观察
频率
是:2: 10,104: 10,106: 10: 19 我想将这些预期
观察
到
的
对
提供给一个算法,以确定骰子确实被篡改
的
可能性有多大。当我在上输入
值
对时,它计算的卡方
值
为16.2,P
值
浏览 2
提问于2014-09-11
得票数 3
2
回答
如何根据R
中
的
频率
重命名观测
值
?
r
、
dataframe
在我
的
数据帧
中
,我正在尝试根据它们各自
的
频率
来重命名列'Name‘
中
的
某些
观察
值
。也就是说,我希望重命名名称
频率
低于100
的
观测
值
。如果任何名称在数据集中出现
的
次数少于100次,我希望在name列中将所有这些
观察
值
重命名为"Base“。如果Ted Williams和Babe Ruth
的
名字在数据框中出现<em
浏览 28
提问于2020-07-12
得票数 0
回答已采纳
1
回答
eViews:以10分钟
的
频率
将季度数据保存在工作文件
中
excel
、
dataset
、
finance
、
economics
、
eviews
我有一个包含季度
观察
值
的
数据集(Excel格式)。对于这些
观察
,我还有一个确切
的
日期和时间,比如: Obs.value,20000101,07:00。我还创建了一个
频率
为10分钟
的
eViews工作文件。现在,我想将季度数据导入到eViews工作文件
中
。对于数据
中
没有对应
值
的
所有(10分钟
频率
)
观察
值
,
观察
值
应为
浏览 10
提问于2013-11-13
得票数 0
1
回答
在R中使用hclust进行加权观测
频率
聚类
r
、
cluster-analysis
、
hierarchical-clustering
、
hclust
我有一个包含500K
观察
值
的
大型矩阵,需要使用分层聚类进行聚类。由于大小,我没有计算距离矩阵
的
计算能力。为了克服这个问题,我选择聚合我
的
矩阵来合并那些相同
的
观察
值
,从而将我
的
矩阵减少到大约10K个
观察
值
。我有这个聚合矩阵
中
每一行
的
频率
。我现在需要将此
频率
作为权重合并到我
的
分层聚类
中
。这些数据是
浏览 15
提问于2017-07-25
得票数 1
1
回答
(从Stata到R)数据挖掘和
变量
创建:计数、列表、排序、egen
r
、
sorting
、
data-mining
、
stata
、
subset
从Stata到R
的
过渡一直是令人兴奋和具有挑战性
的
,但我在R
中
仍在努力
的
一个领域是数据探索,然后是随后
的
变量
创建。具体来说,如何 如果var 2==3 /*计数var2 */上
的
值
为3
的
观测数
浏览 4
提问于2014-12-18
得票数 0
回答已采纳
1
回答
Python:如何定义行为像函数
的
类?
python
、
function
、
class
我想在python
中
定义一个类,它
的
行为像一个带有附加属性
的
函数。特别是,它应该无缝地应用于一个
变量
。from
numpy
import sin, pi def __in
浏览 0
提问于2021-09-07
得票数 3
回答已采纳
1
回答
python
中
不规则高频时间序列数据
的
预处理
machine-learning
、
python
、
time-series
、
bigdata
、
pandas
最初在...posted中使用
的
StackOverflow (可能更适合这里)我正在处理不规则
的
、高频
的
时间序列数据.在一秒钟内,我可以有多个数据点,如下面的timestamp字段所示到目前为止,我只在我们数据
的
一小部分(5天~200万条记录)上使用了Pandas pd.resample(),方法是使用mean作为聚合函数和线性插
值
。Larger图片: 我正在处理来自elasticsearch
的
数以百万计
的
记录(4月至今天
的
数据),
浏览 0
提问于2018-07-06
得票数 1
2
回答
使用hist函数
pandas
我有一个带有信息表
的
csv文件,我需要用可用
的
信息绘制一个hist,该表有日期和数字,我希望日期在x轴上,数字在y轴上,但它正在绘制相反
的
图,下面是详细信息:3 17-06-17 4605 19-06-17 332import
numpy
drive/MyDrive/Colab Notebo
浏览 8
提问于2022-11-10
得票数 0
回答已采纳
1
回答
有办法过滤掉
频率
吗?
python
、
argmax
np.argmax函数返回最高
频率
值
,我想取出这个
值
,然后查看第二个最高
值
是什么。import waveimport matplotlib.pyplot as plt这里有一些代码,但它只是定义了声波
的
数据,与我
的
问题无关frequencies)))print(np.argmax(frequency1
浏览 3
提问于2022-10-23
得票数 0
回答已采纳
2
回答
在使用tabulate时,有没有办法克服Stata
中
“
值
太多”
的
错误?
stata
我正在尝试为Stata
中
的
一个
变量
生成
频率
,条件是另一个
变量
的
类别。当SAS甚至SPSS都可以毫无问题地运行完全相同
的
操作时,Stata竟然会
浏览 11
提问于2014-03-03
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用NumPy实现对满足条件的Tensor索引和值的提取
python对矩阵中每个元素求绝对值的方法
python学习-根据字典中的值的大小,对字典的项进行排序
DeFi观察者:过度中心化和复杂的DeFi代码是对中本聪发明的变异滥用
Python评分卡建模—卡方分箱(2)之代码实现
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券