腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
值
的
数据
子集
部分
r
、
subset
我有一个关于返回产品
的
非常大
的
数据
集,为了创建一个解释性模型,我需要
数据
由返回
的
一半产品(1)和没有返回
的
产品
的
一半(0)组成,因此它们是作为二进制变量给出
的
。我如何从
数据
中随机地将其
子集
出来?以下是
数据
集
的
一
部分
> dput(head(dat, 100)) structure(list(data5.order_id = c(24409499, 24409
浏览 18
提问于2021-11-08
得票数 0
3
回答
基于
列名
部分
匹配
的
子集
数据
r
、
subset
我需要对df进行
子集
,以包含某些字符串。其中一些是完整
的
列名,以下内容也适用:我
的
问题是,我需要扩展它,以包括包含特定字符串
的
列名,这些字符串可能与其他一些列名
部分
匹配。FullColName2","FullColName3", "starPartString1(
浏览 2
提问于2014-06-12
得票数 18
回答已采纳
1
回答
fastai表格模型经过训练,但找不到分类映射
pytorch
、
categorical-data
、
embedding
、
fast-ai
在使用fastai
的
表格模型训练了包含许多分类
数据
的
数据
集之后,我希望读出实体嵌入并使用它来映射到我
的
原始
数据
值
。我可以看到嵌入
的
权重。输入
的
数量似乎与任何内容都不匹配,但可能是
基于
train_ds中
的
唯一分类
值
。 为了得到这个映射,我想从Categorify转换类中获得self.categories字典。有没有什么方法可以从调用TabularList.from_df获得
的
浏览 0
提问于2020-01-12
得票数 0
1
回答
将一个
数据
帧
的
列中
的
值
与另一个
数据
帧中
的
列
的
子集
进行匹配
r
、
match
、
subset
我尝试将一个
数据
帧
的
列中
的
值
与第二个
数据
帧
的
列中
的
值
进行匹配。棘手
的
部分
是,我想使用第二个
数据
帧
的
子集
进行匹配(由第二个
数据
帧中与正在匹配
的
数据
帧中
的
不同列指定)。这不同于通常发布
的
基于
数据
帧之间
的
匹配来尝试
子集<
浏览 1
提问于2013-04-21
得票数 3
回答已采纳
1
回答
根据其
子集
的
均值和标准差更改向量
的
某些
值
r
、
anomaly-detection
我正在尝试将异常注入到
数据
集中,本质上是
基于
某个条件更改某些
值
。我有一个
数据
集,有10个
子集
。条件是异常将是每个分段
的
标准偏差
的
2.8-3倍,远离该
子集
的
平均值。为此,我将
数据
集划分为10个相等
的
部分
,然后计算每个
子集
的
平均值和标准差,并通过将该
子集
的
3个标准差远离该
子集
的
平
浏览 0
提问于2019-01-21
得票数 0
10
回答
子集
数据
仅包含名称与条件匹配
的
列。
r
、
subset
是否有一种方法可以根据列名对
数据
进行
子集
,从特定
的
字符串开始?我有一些类似于ABC_1 ABC_2 ABC_3
的
列,还有一些类似XYZ_1, XYZ_2,XYZ_3
的
专栏。如何仅
基于
包含上述文本
部分
(例如,df或XYZ)
的
列对我
的
ABC进行
子集
?我可以使用索引,但是列在
数据
中太分散了,而且变得太难编码了。另外,我希望只包括这些列中
的
任何一个
值
为>0
的
浏览 8
提问于2013-09-03
得票数 78
回答已采纳
1
回答
如何减去以另一列为条件
的
列
值
r
、
dplyr
我有一个
数据
集,其中我想对每个索引
值
从四分位数
的
q.ret 1中减去四分位数
的
q.ret :下面是执行任务
的
代码:但是它给出了以下错误请提出一些解决这个问题
的
建议
浏览 1
提问于2016-06-19
得票数 1
回答已采纳
1
回答
如何
基于
布尔数组
值
创建熊猫
数据
子集
?
python
、
pandas
、
dataframe
、
subset
、
slice
我正在研究一种熊猫
数据
格式,其中一列(bullish)由布尔
值
组成,第二列(split)也是
基于
布尔
值
的
,每当第一列
值
与前面的列
值
不同时,即为真。= df['bullish'].shift(-1) 现在,我想在split
值
为True
的
每个点将熊猫
数据
分割成更小
的
子集
,这样它就创建了
子集
,其中所有的df['bullish']
浏览 2
提问于2021-11-26
得票数 0
1
回答
无法
子集
Pandas dataframe中
的
数据
python
、
pandas
、
dataframe
、
datetime
基于
某些条件,我尝试从Pandas dataframe创建一个
子集
。我可以创建两个
子集
,但在尝试创建另一个
子集
时出现语法错误。
数据
框是具有列标题
的
.csv文件:编号、环境、阶段、类型、计划结束日期、关闭代码、结束子类别、由更改引起
的
事件、待定更改。我应该尝试使用“计划结束日期”创建一个
子集
,其中计划结束日期离今天日期超过4天
的
记录应该在不同
的
子集
中?我想创建一个包含所有“成功”和“完全成功”记录<e
浏览 1
提问于2019-11-21
得票数 0
1
回答
将R中
的
数据
集分成3个
子集
:低25%、中50%和高25%
r
、
subset
如何根据一列
的
值
将data.frame
数据
分成三个
部分
?我想通过在不同
的
子集
内构建方法来显示曲线
的
u形。我已经知道如何获得随机
的
顶部和底部
的
值
,以及如何获得顶部x和底部x
的
百分比。仍然给出了low.x
的
错误输出)low.x <- subset(final_data, final_data$variablex < quantile(final_da
浏览 1
提问于2018-12-12
得票数 0
1
回答
基于
日期列从单个
数据
框创建n个
子集
数据
框
的
堆栈
r
我需要从一个大
的
df中创建一堆
基于
日期列
的
子集
数据
框(例如,以月-年格式表示
的
“2015年8月”)。它应该类似于subset函数,只是要形成
的
子集
dfs
的
计数应该根据date列上
的
可用
值
动态变化 所有
子集
数据
帧需要具有相似的结构,使得日期列
值
对于每个
子集
df将是一个且相同
的
。假设,如果我
的
大型
浏览 1
提问于2015-08-31
得票数 0
2
回答
如何根据前一行
的
值
选择R
数据
框中
的
行
r
、
dataframe
、
subset
我有一个看起来很简单
的
问题,我还没能解决。我有一个由单列
数据
点组成
的
R
数据
帧,如下所示。我想将其
子集
成一个新
的
数据
帧,其中包含
基于
先前
数据
点
的
值
的
数据
点。下面,举个例子,我想对前一个
值
大于.04
的
所有行进行
子集
。任何想法都将不胜感激。谢谢。
浏览 1
提问于2013-04-03
得票数 1
1
回答
在mars,earth r包中从evimp中提取返回
值
r
地球包在R:你好,我正在运行一个循环,从我
的
主
数据
库中提取1000个
数据
子集
,并运行一系列
基于
火星
的
测试,然后在df中进行总结。我想要提取每次运行时对输入变量重要性进行排序
的
evimp返回
值
(rows=variable名称、cols=#
子集
、GCV、RSS)。但是,我不能将这些
值
提取或添加到dataframe中,因为它是一个"evimp“类。如何提取这些
值
并将其放入表中?
浏览 0
提问于2018-05-13
得票数 3
1
回答
如何在R中从大
数据
文件中加载
部分
数据
r
、
import
、
partial
是否有一种方法只能从大
数据
文件(文本文件格式)加载/导入
数据
的
一
部分
。请建议一下。
浏览 0
提问于2014-07-11
得票数 1
1
回答
如何在lapply中创建多个
子集
r
、
subset
我需要在多个
数据
子集
上运行相同
的
模型。下面是一些模拟
数据
。假设我想做3个t测试,所有测试都比较var1和var2,但是每个测试都是
基于
group
的
3个
值
的
数据
子集
。做这件事最好
的
方法是什么?
浏览 5
提问于2013-08-26
得票数 0
回答已采纳
3
回答
子集
数据
仅包含名称与使用data.table
的
多个条件匹配
的
列
r
、
data.table
、
subset
这是
基于
这个。问题是: 我如何仅
基于
包含上述文本
部分
(例如,ABC或XYZ)
的
列来
子集
我
的
df?我可以使用索引,但是列在
数据
中太分散了,而且变得太难编码了。另外,我希望只包括这些列中任何一个
值</e
浏览 7
提问于2022-07-08
得票数 0
回答已采纳
1
回答
如何
基于
列
值
获取
数据
数据
的
子集
?
python
、
pandas
、
dataframe
我有一个包含列中当前
值
的
dataframe:CT (mm) A B C D adultos_perc min max class_center Y13 230-240 0 8 3 2 1.000000 230 240 235 -inf 我想要创建一个新
的
dataframe,其中只有"Y“
值
不是'inf‘或'-inf’
的
行。data
浏览 4
提问于2022-04-21
得票数 0
回答已采纳
2
回答
遍历结构化文件
的
2列
python
、
pandas
、
filtering
、
gzip
我正在试图解析一个巨大
数据
集
的
一个
部分
。我拥有的
数据
集
的
部分
是一个3GB
的
gzip文件。该文件是结构化
的
,因此它有x列和数百万行。列之间用逗号或某种普通操作符分隔,这样我就可以读取文件了。我想要做
的
是
基于
两个范围(即
值
a< col1 <
值
b,
值
c< col2 <
值
d),检查
数据
集每一行
的
浏览 1
提问于2019-02-16
得票数 0
回答已采纳
1
回答
用于在进行选择时动态地发现允许
子集
的
算法/
数据
结构
algorithm
、
data-structures
、
subset
我正在开发一个应用程序,它显示了用户输入
的
表单。该表单有N个
部分
,每个
部分
有X个单选按钮。提供了有效选择
的
子集
,以便当用户跨区段工作时,
基于
形成有效
子集
的
可能性来启用/禁用其他区段中
的
按钮。例如:第1节有用于选择A、B和C
的
单选按钮第2节有用于选择1、2、3和4
的
按钮第3节有用于选择x、y和z
的
按钮 有效
子集
是({A,2,z},{B},{B,1,x},{
浏览 3
提问于2014-08-05
得票数 2
1
回答
放大
数据
、重新调整y轴比例
的
最有效方法
python
、
matplotlib
、
plot
、
jupyter-notebook
我正在处理一个大型
的
时间序列
数据
集,绘制(3,1,x)个
子集
,所有的
子集
都是根据相同
的
时间戳绘制
的
。由于
数据
相当大,为了进行分析,我需要“放大”
部分
,并在微观层面上比较这三个图表。我认为最简单
的
方法是首先绘制完整
的
数据
集,然后在每个子图上使用xlim函数,以便只看到感兴趣
的
部分
。问题是“缩放”图上
的
y轴比例是完全不成比例
的
。我想
浏览 13
提问于2017-03-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
区块链创新的未来,基于DAPP的部分思考
基于部分可见异常样本的异常检测问题
图像处理之基于色比色差定律的插值算法
值440的WinHex数据恢复教程
数据的来源和缺失值处理
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券