腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
Python
-
创建
具有
相关
数值
变量
的
数据
集
python
、
random
我想
创建
一个
数据
集
,其中我有1到10年
的
经验,工资从30k到100k。我希望这些薪水是随机
的
,并遵循多年
的
经验。有时,经验丰富的人可能比经验较少的人赚得少。| 28500... 10 | 100,500 以下是我到目前为止所做
的
工作
浏览 100
提问于2018-07-11
得票数 4
回答已采纳
2
回答
如何在一个
数据
集中运行多个线性回归/
相关
r
、
loops
、
regression
、
linear-regression
、
correlation
我有一个excel/csv格式
的
数据
集
。我希望运行许多简单
的
线性回归/
相关
(每个都有一个p值)。我想
创建
一个循环,而不是手动运行每
浏览 0
提问于2017-01-26
得票数 0
1
回答
日期、时间、类别和数字
变量
之间
的
相关
性
python
、
r
我有一个非常大
的
数据
集
,包含所有类型
的
变量
:日期、时间、分类和
数值
变量
。它是引用雇用记录
的
数据
集
。我想知道它们之间是否存在
相关
变量
。我知道,要建立一个正常
的
相关
矩阵,我应该只对
数值
变量
进行规范化,但事实并非如此。有别的选择吗?
浏览 7
提问于2022-10-03
得票数 -1
2
回答
如何在
Python
中计算
相关
比或Eta?
python-3.x
、
pandas
、
statistics
、
correlation
、
categorical-data
根据这个
的
答案, 在名义
变量
和区间
变量
(“
数值
”)之间最典型
的
“
相关
”度量是Eta,也称为关联比,它等于单向方差
的
根R平方(p值= ANOVA)。Eta可以看作是一种对称
的
关联度量,如
相关
性,因为方差分析
的
Eta (名义上为独立,
数值
为相依)等于Pillai
的
多元回归迹(以数字为独立
的
,虚拟
变量
集
对应于名义上
的</em
浏览 7
提问于2018-08-29
得票数 1
回答已采纳
2
回答
找出R中
数据
的
前10个
相关
特征
r
、
correlation
、
feature-selection
、
feature-engineering
我有一个非常大
的
数据
集
。我需要找出哪些
变量
在
数据
集中
具有
最高百分比
的
相关
性。文件: CW_ModelDevelopment仅选择
数值
# Sele
浏览 3
提问于2021-04-27
得票数 0
2
回答
如何管理多个
数据
集
-机器学习Azure
azure-machine-learning-studio
、
data-transform
是否存在接受多个
数据
集
进行处理
的
模块?例如,“拆分
数据
”、“编辑元
数据
”和“选择
数据
集中
的
列”不接受多个
数据
集
作为输入。 这就是我所做
的
:在我
的
模型中有几个数字和分类
变量
。我使用“转换为指示器
变量
”模块为我
的
数据
创建
虚拟
变量
。如何将指标
变量
和
数值
变量
浏览 28
提问于2019-04-11
得票数 0
1
回答
如何使用
Python
绘制
数据
集
的
每个属性与目标属性之间
的
相关
系数图
python
、
numpy
、
pandas
、
scikit-learn
、
sklearn-pandas
我是
Python
新手,需要绘制每个属性
的
相关
系数与目标值之间
的
关系图。我有一个包含大量值
的
输入
数据
集
。我提供了示例
数据
集
值,如下所示。与result类似,我还有一些其他列(在示例中没有提到)
具有
字符串值。这里,我需要计算同时
具有
字符串值和整
数值
的
列
的
值。使用字典,我为每个
具有
字符串值
的
列分配了一个值。因此赋值如
浏览 0
提问于2016-02-16
得票数 1
3
回答
如何在matlab中像在R中一样读取csv文件?
r
、
matlab
、
csv
、
import-from-csv
我有一个另存为.csv文件
的
数据
集
,如下所示:John,9,\i1iiu1h8Bob,33,\kljhjjX = read.csv("file.csv",header=TRUE) 在Matlab中是否有一个默认命令可以读取同时包含
数值
变量
和字符串
变量
的
.csv文件?csvread似乎只喜欢
数值
变量
。
浏览 4
提问于2013-01-24
得票数 8
回答已采纳
1
回答
范畴
变量
的
多重共线性
r
、
statistics
、
linear-regression
对于
数值
/连续
数据
,为了检测预测
变量
之间
的
共线性,我们使用了皮尔逊
相关
系数,并确保了预测
变量
之间没有
相关
性,而是与响应
变量
相关
。但是,如果我们有一个
数据
集
,那么如何检测multicollinearity,其中
的
预测器都是分类。我正在共享一个
数据
集
,其中我试图找出预测
变量
是否
相关
。Yes Yes Yes
浏览 1
提问于2015-10-28
得票数 11
1
回答
将值传递给J量器中
的
参数
jmeter
假设RequestParameter as StudentList列表中有一个
变量
,其中StudentList是一个类,如下所示:{} 学生是否有字段firstName、lastName etc.How将值作为请求参数传递给and中
的
list
变量
?
浏览 2
提问于2016-03-21
得票数 1
1
回答
提取归一化样本
python
python-3.x
、
dataset
、
extraction
我需要从10亿个
数据
库中提取1%
的
样本。这1%应该在一个
数值
变量
上均匀分布。例如,如果
数据
集
有1000行,而
数值
变量
的
值为1-10,则输出示例
具有
一个
数据
集
,其中每个值
的
每一行都有一个
数据
集
。
浏览 1
提问于2015-07-09
得票数 0
1
回答
R-强制默认绘图函数为散点图
r
、
logistic-regression
、
scatter-plot
我正在尝试绘制一个
数据
集
,在y轴上
具有
2个水平因子,在x轴上
具有
一个
数值
变量
,以便绘制逻辑回归。然而,当我尝试
创建
一个图时,我得到
的
是条形图而不是散点图。有没有办法强制R将其绘制为散点图?我尝试过其他
的
散点图方法(ggplot2,car中
的
散点图),但我也遇到了让它们绘制逻辑曲线
的
问题,因此我尝试使用默认
的
绘制方法。绘图代码- plot(Threatened~tl_mm.log,
浏览 27
提问于2020-12-01
得票数 0
回答已采纳
1
回答
在特征选择中要考虑什么方差阈值?
feature-selection
、
variance
考虑一个
具有
连续
变量
的
数值
数据
集
,该
数据
集
已被缩放到以0,1范围内
的
值结束。如何计算所有
变量
的
合理方差阈值?
浏览 0
提问于2019-08-29
得票数 0
回答已采纳
1
回答
为什么在计算Gower距离之前需要检查
数据
的
分布情况?
machine-learning
、
r
、
clustering
、
similarity
我阅读这篇文章(
具有
数值
变量
和分类
变量
的
聚类
数据
集
)是为了学习如何对
数据
集
进行聚类,而不仅仅是使用
数值
变量
。在计算Gower距离之前,先绘制
数据
分布图,然后对正偏分布进行对数变换。(右上角
的
那个) 有人知道这么做
的
原因吗?你能简单地解释一下吗?谢谢!
浏览 0
提问于2021-06-18
得票数 1
回答已采纳
1
回答
SAS中所有
数值
列
的
相关
矩阵和统计
matrix
、
statistics
、
sas
、
correlation
我有一个名为final_data
的
数据
集
,其中包含
数值
字段和一些字符串字段。我想要做
的
是现在我知道如何通过显式指定
变量
来计算平均值min和max,但我不知道如何计算
数值
。我也不知道如何计算缺失值
的</e
浏览 0
提问于2012-08-07
得票数 0
回答已采纳
1
回答
R-通过删除作为因素
的
数据
创建
子集。
r
我有一个包含
数值
和分类
变量
的
缺失值
的
数据
集
。我计划通过为
数值
变量
创建
一个子集,为分类
变量
创建
一个子集,然后在每个
变量
上应用
相关
的
mice方法来估算缺失
的
值。我目前正在尝试为
数值
变量
创建
子集,但我在这样做时遇到了困难。我试图通过删除作为因素(即分类)
的
列来<e
浏览 5
提问于2020-05-19
得票数 1
回答已采纳
1
回答
范畴
变量
分析
categorical-data
、
correlation
我
的
数据
集
由一个
数值
变量
(称为"N4")和几个影响
数值
变量
的
分类
变量
组成。例如,有一个名为"die“
的
分类
变量
,如果它等于"alpha”,那么N4
的
值大约为100,如果它等于"beta“,那么N4
的
值大约为300。 我
的
目标是找出哪些类别
变量
对我
的
数值<
浏览 0
提问于2022-01-04
得票数 0
回答已采纳
4
回答
在关系
数据
库中存储科学
数据
sql
、
database
、
storage
我想在关系
数据
库(MySQL或SQLite)中存储分层
的
二维科学
数据
集
。每个
数据
集
都包含一个
数值
数据
表,其中包含任意数量
的
列。此外,每个
数据
集
可以
具有
一个或多个与其表
的
给定行
相关
联
的
相同类型
的
子项。每个
数据
集
通常
具有
1到100列和1到1.000.000行。<
浏览 1
提问于2011-03-16
得票数 3
回答已采纳
1
回答
创建
具有
200k唯一值
的
伪
变量
python
、
jupyter-notebook
、
data-science
我试图为分类
数据
集
创建
一个虚拟
变量
,但问题是
python
没有兼容
的
ram来运行代码,因为唯一值太大而无法
创建
虚拟
变量
。它是一个
具有
500k行和200k唯一值
的
大型
数据
集
。是否可以
创建
一个
具有
200k唯一值
的
虚拟
变量
?
浏览 0
提问于2021-04-21
得票数 2
2
回答
关联矩阵对二进制分类任务是否有意义?
classification
、
correlation
、
binary
当使用二进制目标(y)
变量
检查
数据
集
时,我想知道
相关
矩阵是否有助于确定每个
变量
的
预测能力。 我
的
预测器(X)包含一些
数值
变量
和一些因素
变量
。
浏览 0
提问于2016-10-04
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Python中进行探索式数据分析
Python提取ABAQUS结果数据
这十二个用于Python 数据操作的 Pandas 方法你还不知道?
《Python入门02》人生苦短,要学python
力压 R,Python 在数据科学领域风生水起
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券