Python -创建具有相关数值变量的数据集_如何在其中追加具有相同变量名称但不同数值的数据集？_无法在具有其他数值和类别变量的数据集中创建基于时间的要素 - 腾讯云开发者社区

python、random

我想创建一个数据集，其中我有1到10年的经验，工资从30k到100k。我希望这些薪水是随机的，并遵循多年的经验。有时，经验丰富的人可能比经验较少的人赚得少。| 28500... 10 | 100,500 以下是我到目前为止所做的工作

浏览 100提问于2018-07-11得票数 4

回答已采纳

2回答

如何在一个数据集中运行多个线性回归/相关

r、loops、regression、linear-regression、correlation

我有一个excel/csv格式的数据集。我希望运行许多简单的线性回归/相关(每个都有一个p值)。我想创建一个循环，而不是手动运行每

浏览 0提问于2017-01-26得票数 0

1回答

日期、时间、类别和数字变量之间的相关性

python、r

我有一个非常大的数据集，包含所有类型的变量:日期、时间、分类和数值变量。它是引用雇用记录的数据集。我想知道它们之间是否存在相关变量。我知道，要建立一个正常的相关矩阵，我应该只对数值变量进行规范化，但事实并非如此。有别的选择吗？

浏览 7提问于2022-10-03得票数 -1

2回答

如何在Python中计算相关比或Eta？

python-3.x、pandas、statistics、correlation、categorical-data

根据这个的答案，在名义变量和区间变量(“数值”)之间最典型的“相关”度量是Eta，也称为关联比，它等于单向方差的根R平方(p值= ANOVA)。Eta可以看作是一种对称的关联度量，如相关性，因为方差分析的Eta (名义上为独立，数值为相依)等于Pillai的多元回归迹(以数字为独立的，虚拟变量集对应于名义上的</em

浏览 7提问于2018-08-29得票数 1

回答已采纳

2回答

找出R中数据的前10个相关特征

r、correlation、feature-selection、feature-engineering

我有一个非常大的数据集。我需要找出哪些变量在数据集中具有最高百分比的相关性。文件: CW_ModelDevelopment仅选择数值 # Sele

浏览 3提问于2021-04-27得票数 0

2回答

如何管理多个数据集-机器学习Azure

azure-machine-learning-studio、data-transform

是否存在接受多个数据集进行处理的模块？例如，“拆分数据”、“编辑元数据”和“选择数据集中的列”不接受多个数据集作为输入。这就是我所做的:在我的模型中有几个数字和分类变量。我使用“转换为指示器变量”模块为我的数据创建虚拟变量。如何将指标变量和数值变量

浏览 28提问于2019-04-11得票数 0

1回答

如何使用Python绘制数据集的每个属性与目标属性之间的相关系数图

python、numpy、pandas、scikit-learn、sklearn-pandas

我是Python新手，需要绘制每个属性的相关系数与目标值之间的关系图。我有一个包含大量值的输入数据集。我提供了示例数据集值，如下所示。与result类似，我还有一些其他列(在示例中没有提到)具有字符串值。这里，我需要计算同时具有字符串值和整数值的列的值。使用字典，我为每个具有字符串值的列分配了一个值。因此赋值如

浏览 0提问于2016-02-16得票数 1

3回答

如何在matlab中像在R中一样读取csv文件？

r、matlab、csv、import-from-csv

我有一个另存为.csv文件的数据集，如下所示：John,9,\i1iiu1h8Bob,33,\kljhjjX = read.csv("file.csv",header=TRUE) 在Matlab中是否有一个默认命令可以读取同时包含数值变量和字符串变量的.csv文件？csvread似乎只喜欢数值变量。

浏览 4提问于2013-01-24得票数 8

回答已采纳

1回答

范畴变量的多重共线性

r、statistics、linear-regression

对于数值/连续数据，为了检测预测变量之间的共线性，我们使用了皮尔逊相关系数，并确保了预测变量之间没有相关性，而是与响应变量相关。但是，如果我们有一个数据集，那么如何检测multicollinearity，其中的预测器都是分类。我正在共享一个数据集，其中我试图找出预测变量是否相关。Yes Yes Yes

浏览 1提问于2015-10-28得票数 11

1回答

将值传递给J量器中的参数

jmeter

假设RequestParameter as StudentList列表中有一个变量，其中StudentList是一个类，如下所示：{} 学生是否有字段firstName、lastName etc.How将值作为请求参数传递给and中的list变量？

浏览 2提问于2016-03-21得票数 1

1回答

我有一个包含数值和分类变量的缺失值的数据集。我计划通过为数值变量创建一个子集，为分类变量创建一个子集，然后在每个变量上应用相关的mice方法来估算缺失的值。我目前正在尝试为数值变量创建子集，但我在这样做时遇到了困难。我试图通过删除作为因素(即分类)的列来<e

浏览 5提问于2020-05-19得票数 1

回答已采纳

1回答

范畴变量分析

categorical-data、correlation

我的数据集由一个数值变量(称为"N4")和几个影响数值变量的分类变量组成。例如，有一个名为"die“的分类变量，如果它等于"alpha”，那么N4的值大约为100，如果它等于"beta“，那么N4的值大约为300。我的目标是找出哪些类别变量对我的数值<

浏览 0提问于2022-01-04得票数 0

回答已采纳

4回答

在关系数据库中存储科学数据

sql、database、storage

我想在关系数据库(MySQL或SQLite)中存储分层的二维科学数据集。每个数据集都包含一个数值数据表，其中包含任意数量的列。此外，每个数据集可以具有一个或多个与其表的给定行相关联的相同类型的子项。每个数据集通常具有1到100列和1到1.000.000行。<

浏览 1提问于2011-03-16得票数 3

回答已采纳

1回答

创建具有200k唯一值的伪变量

python、jupyter-notebook、data-science

我试图为分类数据集创建一个虚拟变量，但问题是python没有兼容的ram来运行代码，因为唯一值太大而无法创建虚拟变量。它是一个具有500k行和200k唯一值的大型数据集。是否可以创建一个具有200k唯一值的虚拟变量？

浏览 0提问于2021-04-21得票数 2

2回答

关联矩阵对二进制分类任务是否有意义？

classification、correlation、binary

当使用二进制目标(y)变量检查数据集时，我想知道相关矩阵是否有助于确定每个变量的预测能力。我的预测器(X)包含一些数值变量和一些因素变量。

浏览 0提问于2016-10-04得票数 6

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云