腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
基于
列
值
分组
的
子集
数据
r
、
dataframe
、
filter
、
dplyr
、
subset
下面的
数据
是按照它们
的
id
分组
的
,我试着根据以下条件对这个
数据
框进行
子集
:对于任何id有D2 == 1
的
数据
,删除我们第一次观察到
的
行下面的行。其次,对于具有D1 == 0和D2 == 0
的
任何id,删除此点以下
的
行(如果此id在此之前没有D2 == 1 )。
浏览 8
提问于2020-07-03
得票数 1
回答已采纳
1
回答
R集合DataFrame分析
r
我试图对R中
的
dataframe中
的
数据
子集
执行几个分析,我想知道是否有通用
的
方法来做到这一点。比如说,我有一个
数据
,就像: [1,] 1 6 11 16 [3,] 38 11 18 [5,] 5 10 15 20 我如何应用
基于
“一”条件下
的
<em
浏览 2
提问于2014-03-19
得票数 0
回答已采纳
1
回答
在Spark SQL中使用groupby
的
最佳实践是什么?
apache-spark
、
apache-spark-sql
我有一个按多
列
分组
的
Spark SQL。我想知道
列
的
顺序是否对查询性能有影响。 在较早
的
时间放置具有更多不同
值
的
列
是否有帮助?我假设groupby
基于
某种散
列
/混洗算法。如果第一个groupby可以将
数据
分发到可以保存在一台机器上
的
较小
子集
,则后面的groupby可以在本地完成。这是真的吗? groupby
的
最佳实践是
浏览 8
提问于2019-03-10
得票数 0
2
回答
dplyr用dataframe
的
函数进行总结
r
、
group-by
、
dplyr
简而言之,我有一个函数,它以dataframe作为输入,并返回一个(数字)
值
;我希望能够将这个函数应用到一个dataframe
的
几个
子集
中。我觉得应该能够使用group_by()来指定dataframe
的
子集
,然后沿着管道传递到汇总()函数,但我不确定如何将(subsetted)
数据
格式传递给我想要应用
的
函数。作为一个简化
的
例子,假设我使用
的
是虹膜
数据
集,并且我有一个相当简单
的
函数,我想将它应用于<
浏览 2
提问于2015-03-28
得票数 13
回答已采纳
1
回答
如何编写带有"Group“
的
查询以获得指定
的
输出?
sql-server-2008
、
reporting-services
、
business-intelligence
tblReservation.Room, tblPrice.Price,此查询显示
的
输出如下(矩阵布局MSBI),我
的
查询输出如下,我
的
报告设计布局是,我想要
的
是,在我
的
矩阵布局中,100号房间是1999和2013年
的
两次。我要把这个排在我
的
矩阵布局中。我该怎么办?谢谢。
浏览 6
提问于2013-09-30
得票数 0
回答已采纳
3
回答
子集
a
数据
集-
分组
和多值R
r
、
subset
、
group
我试图在一
列
中用多个
值
来
子集
数据
。 产出应是:因此,我只想要新
的
dataframe中
的
行,其中包含0和
列
"Auto“中
的
1 --为每个商店
分组
。已经试过了,但不起作用: 测试<-
子集
( rawdata,Auto == 0 &Auto == 1)测试<-
子集
(rawdata,min(Auto) == 0& max(Auto) ==
浏览 10
提问于2022-03-11
得票数 -1
回答已采纳
3
回答
如何根据组中另一
列
的
值
来填充np.nan
列
?
python
、
pandas
、
group-by
我有一个
数据
帧
的
子集
,我需要使用
分组
和
基于
另一
列
的
条件进行回填。, "bc", "2020-05-10"],df 本质上,对于产品
的
一个
子集
,我需要根据当前日期回填这些
值
。例如:对于pr
浏览 10
提问于2021-06-04
得票数 1
回答已采纳
3
回答
快速融合
的
data.table操作
r
、
dataframe
、
data.table
、
aggregation
、
reshape2
我正在寻找用于操作data.table对象
的
模式,其结构类似于使用reshape2包中
的
melt创建
的
数据
帧。我正在处理具有数百万行
的
数据
表。性能至关重要。这个问题
的
一般形式是,是否有一种方法可以
基于
列
中
的
值
子集
执行
分组
,并使
分组
操作
的
结果创建一个或多个新
列
。这个问题
的
一个具体形式可能是如何使
浏览 0
提问于2012-12-20
得票数 8
回答已采纳
1
回答
如何
基于
布尔数组
值
创建熊猫
数据
子集
?
python
、
pandas
、
dataframe
、
subset
、
slice
我正在研究一种熊猫
数据
格式,其中一
列
(bullish)由布尔
值
组成,第二
列
(split)也是
基于
布尔
值
的
,每当第一
列
值
与前面的
列
值
不同时,即为真。= df['bullish'].shift(-1) 现在,我想在split
值
为True
的
每个点将熊猫
数据
分割成更小
的
子集
,这样它就创建了
浏览 2
提问于2021-11-26
得票数 0
2
回答
在不分离
分组
变量
的
情况下均匀拆分
数据
文件
r
、
dataframe
、
dplyr
TRUE), as_tibble() %>% 其中group是我
的
分组
变量,每个
值
发生在不同
的
频率(例如,group == "a"发生5次,group == "b"发生6次,等等)。我需要尽可能均匀地将这些
数据
分割成n = 9
子集
数据
。但是,问题是我不能在
子集
之间拆分
浏览 0
提问于2019-03-25
得票数 3
回答已采纳
3
回答
按条件细分
分组
行
r
我有一个按一
列
中
的
值
分组
的
数据
集。我希望创建一个
子集
,具体取决于其他
列
的
值
是不同
的
还是相等
的
。"A","A","B","B","C","C","D","D"),
浏览 6
提问于2022-08-30
得票数 0
5
回答
Python大熊猫:需要知道有多少人达到了两个标准
python
、
pandas
使用此
数据
集,我希望了解为a和b两种类型付款的人员(id)。希望与同时支付a和b付款的人一起创建
数据
子集
。(这只是一个示例
数据
集,我使用
的
数据
要大得多) 我尝试按id进行
分组
,然后在其中创建
数据
子集
type.len >= 2,然后尝试创建另一个
基于
条件df.loc(df.type == 'a') & (df.type== 'b')
的
子集<
浏览 12
提问于2021-01-22
得票数 0
回答已采纳
1
回答
R根据定量
子集
总结定性
数据
(dplyr?)
r
、
subset
、
plyr
、
dplyr
我真的很难搞清楚如何做一种反向分析,在这种情况下,我用数量值来划分
数据
,并根据这些组总结描述性
的
统计
数据
。), class = "data.frame", row.names = c(NA, -10
浏览 4
提问于2015-04-20
得票数 0
回答已采纳
1
回答
为什么Postgres允许我在组中没有
列
?
sql
、
postgresql
在docs中:“当GROUP BY存在时,SELECT列表表达式引用未
分组
的
列
是无效
的
,除非在聚合函数中,因为将有多个可能
的
值
来返回一个未
分组
的
列
。”如果我将fac.id添加到select表达式中,就会得到预期
的
"ERROR: fac.id“
列
必须出现在GROUP子句中,或者在聚合函数中使用。(原始查询中还有很多其他
列
,它们也以同样
的
方式违背了我
浏览 0
提问于2014-04-01
得票数 2
回答已采纳
1
回答
递归遍历SQLite表以查找匹配
的
记录
子集
sqlite
、
recursion
我有一个包含3个文本字段
列
(A、B和C)
的
表格,它是从一个包含数千行
的
平面文件中导入
的
。这些字段都没有唯一约束,也没有主键组合。因此,一个或多个记录可能具有相同
的
值
,甚至会有记录在所有字段中具有相同
的
值
。在许多记录中,
列
A、B和C应该是相同
的
,但由于
数据
质量问题,
列
C有许多变化,其中
列
A和B是相同
的
。在
列
A和B相同
的</
浏览 10
提问于2019-11-24
得票数 0
回答已采纳
3
回答
如何根据空单元格
的
列
的
条件语句将一
列
的
值
相加?
r
、
dplyr
、
subset
、
summarize
我正在尝试根据
列
的
条件语句设置
数据
子集
,该
列
的
值
为空
值
,这意味着员工在一个工作订单上登录了多次。示例
数据
集如下所示: employee_name <- c("Person A","Person A","Person A","Person A","Person A", "Person B","Pers
浏览 20
提问于2020-07-30
得票数 1
回答已采纳
1
回答
为
分组
数据
帧中
的
唯一行创建布尔
列
python
、
pandas
、
dataframe
我有一个
分组
数据
框架df_grouped,我想创建一个新
的
布尔
列
df_grouped["Unique"],对于
分组
的
每个
子集
,如果location
的
值
在
分组
中是唯一
的
,那么这个
列
就是True &如果它不是唯一
的
'Paris','Paris','Berlin']} df = p
浏览 2
提问于2022-08-15
得票数 0
回答已采纳
1
回答
用EF动态创建GroupBy和Select
c#
、
entity-framework
我正在使用一个相当大
的
SQL视图(50+
列
)。为了确保获得正确
的
数据
,我必须选择
列
的
子集
(4或5
列
)并按该
子集
分组
。(否则,我将返回额外
的
数据
)。我目前运行
的
查询如下 .GroupBy(g => new g.id,= x.Key.Valu
浏览 1
提问于2014-10-14
得票数 3
回答已采纳
1
回答
基于
列
的
分组
生成
数据
帧
子集
向量
r
、
vector
、
dataframe
假设我有这个R
数据
框架:1 1295234818000 2011 1 17"year", "month", "day"), row.names = c(NA, 10L), class = "data.frame") 是否有一种方法可以创建
数据
帧
的
向量,其中每一个都是原始
数据</e
浏览 5
提问于2014-02-19
得票数 3
1
回答
sqlite3从现有
数据
库创建另一个
数据
库
python
、
sql
、
sqlite
我有一个很大
的
数据
集,需要一个
基于
某些
列
的
值
的
子集
。我想从这个
子集
创建另一个
数据
库。我该如何用Python语言中
的
sqlite3做到这一点呢?另外,如何根据另一
列
的
值
对某些
列
进行排序并计算其平均值? 谢谢
浏览 2
提问于2016-06-06
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel综合应用:如何显著标记出两列数据中的不同值?
给 Excel 列表中的一列数据补全除自己外的所有其他值,单列变矩阵
AI机器学习-决策树-Python实现ID3算法
想成为高效数据科学家?不会Pandas怎么行
深入分析Druid存储结构
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券