腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
按
类别
获取
Python
dataframe
中
的
随机样本
、
我想从每个
类别
中
随机抽取10个项目,以便剩余
的
数据帧只包含这些记录。 我已经尝试过df.sample(),但它只给了我所有的示例。我可以通过df.iterrows()做到这一点,但我希望有一个更简单
的
解决方案。
浏览 0
提问于2016-12-27
得票数 11
回答已采纳
2
回答
从Spark GroupedData对象中选择随机项目
、
、
、
我刚开始在
Python
中使用Spark,并且一直无法解决这个问题:在pyspark.sql.
dataframe
.
DataFrame
上运行groupBy之后df.groupBy('teamId') 如何从每个结果组(
按
teamId分组)中选择N
随机样本
而不进行替换?我基本上是尝试从每个团队
中
随机选择N用户,也许一开始使用groupBy是错误
的
?
浏览 0
提问于2015-11-17
得票数 21
回答已采纳
1
回答
TSQL
随机样本
、
、
我需要根据表
中
2个不同变量
的
比率,使用TSQL从表中选择一个
随机样本
。4:1 (男性/女性)
类别
变量4:3:2:1 (重/
中
/轻/极轻)
类别
变量
浏览 0
提问于2018-05-23
得票数 0
1
回答
Python
Pandas -从二进制数据
中
采样一定数量
的
个体
、
、
、
、
下面是我正在使用
的
DF
的
一个虚拟示例。它有效地包括入库数据,其中第一列给出了一个
类别
,第二列给出了该
类别
中
的
个人数量。df = pd.
DataFrame
(data={'Category':['A','B','C','D','E','F','G','H','I'],
浏览 13
提问于2021-02-09
得票数 0
回答已采纳
3
回答
具有特定计数
的
Dataframe
随机样本
、
、
假设我有一个带有二进制变量b (b
的
值为0或1)
的
dataframe
b。如何从这个数据
中
获取
大小为10
的
随机样本
,以便在
随机样本
中有2个b=0实例,在数据中有8个b=1实例?现在,我知道我可以做df[sample(nrow(df),10,]来获得部分答案,但是这会给我一个随机
的
0和1个实例。如何在仍在随机抽取样本
的
同时指定0和1个实例
的
特定数量?
浏览 11
提问于2022-03-30
得票数 1
回答已采纳
1
回答
混合数据类型
的
采样技术
、
、
我正在寻找一种非常具体
的
抽样技术,它属于一个非常大
的
数据集,具有混合数据类型,即,我有分类变量和连续变量,并且希望有一个尽可能接近地表示这类数据
的
总体
的
样本。如果有人能帮我解决这件事,我会很感激
的
。
浏览 0
提问于2021-09-06
得票数 1
回答已采纳
1
回答
运行唯一样本
、
、
、
我编写了一些代码,根据特定
的
标准随机抽取样本,并循环使用标准来
获取
特定项目的特定数量
的
样本。
随机样本
正在收集ID。我需要随机
的
身份证,我要所有的都是独一无二
的
。如果
随机样本
的
ID已经附加到完整
的
随机ID列表
中
,那么我希望它重新运行特定
的
迭代,直到在完整
的
附加列表
中
找不到
随机样本
中
的
ID为止。
随机样本</
浏览 3
提问于2022-06-07
得票数 0
3
回答
MultiIndex
DataFrame
抽样
、
、
、
我正在使用一种名为MultiIndex
DataFrame
DataFrame
的
df_data
中
的
面板数据n time这是一个平衡
的
面板。我想创建一个
随机样本
的
nn=100个人与替代。另外,如果一个人进入了
随机样本
,那么这个个体
的
所有4次观测(t=0,1,2,3)都应该分配给样本。所以如果创建
的
随机变量列表是2,3,2,4,1,.然后,第三个
浏览 3
提问于2016-01-20
得票数 9
回答已采纳
3
回答
Python
:每组
获取
2组
随机样本
、
我有一只熊猫,
DataFrame
说:0 a 12 a 34 a910 c 1112 c 1314 c 15Set1,每组1个样本:3 a
浏览 7
提问于2016-06-21
得票数 1
回答已采纳
2
回答
Python
:命名占位符如何组织字符串数组
中
的
数据?
、
、
、
我正在使用Firebase数据库。我正在阅读一个孩子,并接收以下数据:Connection = db.child(UniqueID).child("Devices").get()print(Data)print(Data[1])[None,{'DeviceAddress': '1', 'DeviceType': 'Heat', 'Status': 'Heat Alarm'}, {
浏览 19
提问于2020-05-14
得票数 1
回答已采纳
2
回答
Pyspark:如何从spark数据帧
中
过滤10000个随机元素
、
如何从我
的
spark
DataFrame
中提取10000个元素
的
随机样本
? 我需要像Pandas
中
的
示例函数这样
的
东西
浏览 101
提问于2019-10-11
得票数 2
回答已采纳
1
回答
Python
中
的
分组直方图
、
有没有一种简单
的
方法来创建由分类变量(cyl=4,8)过滤
的
连续变量(mpg)
的
直方图?因此,基本上我需要两个
按
cyl分组
的
mpg直方图,一个用于cyl=4,一个用于cyl=8。
浏览 2
提问于2020-10-05
得票数 0
2
回答
在bash中提取排序
类别
中
的
随机唯一样本
、
、
、
、
我有一个大
的
未排序
的
CSV文件(>4M记录)。每个记录都有一个
类别
,在前三列
中
对其进行了描述。记录
的
其余部分是地址数据,这些数据可能是唯一
的
,也可能不是唯一
的
。A1tC, 3, e, address3 # the category for this record is C3e我想在每个
类别
中
抽取一个唯一记录
的
随机样本
浏览 4
提问于2014-09-28
得票数 1
回答已采纳
2
回答
熊猫:在列中使用groupby if值是字典
、
、
':809}IT {'lenovo':200, 'iphone':300, 'mac':200} 我需要群
按
类别
和结果连接字典,并选择3个键与最大
的
值。接下来,
获取
dataframe
,在列category
中
,我有唯一
的
类别
,在列da
浏览 5
提问于2016-10-12
得票数 2
回答已采纳
1
回答
有没有办法根据有序
类别
中
的
项目数量来过滤熊猫数据帧?
、
、
基本上,我有一个pandas数据帧,它有一个不方便
的
有序
类别
字段,我甚至可能不知道
类别
值是什么,我只知道它是有序
的
,
类别
中有三个值: import pandas as pd dfs = pd.
DataFrame
'abbacabac'), categories=['a', 'b', 'c'], ordered=True), 'C2': [1,2,3,4,5,6,7,8,9]}) 例如,我可以
浏览 22
提问于2020-09-16
得票数 2
回答已采纳
2
回答
创建Pandas
Dataframe
中
由另一列分区
的
列
的
所有可能排列
、
、
、
我有这样
的
数据:我
的
目标是:解释: 期望状态:
获取
按
订单顺序购买
的
客户
类别
的所有可能排列。处于期望状态
的
Category1表示
按
第一阶购买
的
类别
,Category2表示以二阶购买
的
类别
,等等。我正在使用<em
浏览 3
提问于2017-01-27
得票数 3
1
回答
Python
按
类别
分组,然后
按
类别
绘制
、
、
、
、
很简单
的
熊猫问题,我是个初学者。我有一个
dataframe
'df‘(例如):df = pd.
DataFrame
({'time': ['2019-04-23 10:21:00', '2019-category': ['A', 'B', 'A'], 'text': ['njrnfrjn',
浏览 1
提问于2020-04-26
得票数 0
回答已采纳
1
回答
熊猫数据
按
组回归,并添加具有预测值和β/t统计量
的
列。
、
、
、
、
下面是我
的
dataframe
的
一个示例:0 Apple 0.083050996 0.164056482 0.519875358Carrot 0.588121494 0.750480977 0.615399987现在,我希望代码能够对每个
类别
(即,
按
类别
分组
的
横截面回归(针对苹果
浏览 3
提问于2017-02-08
得票数 2
回答已采纳
1
回答
获取
DataFrame
Python
类别
的特定值
、
、
我希望将特定
类别
的特定值附加到列表
中
。下面是我
的
代码: amesData = pd.read_csv(fileName, usecols = ['Zip Code','Score']) for result inamesData['Zip Code']: listData = amesData['Score'] 这就是我正在尝试
的
,但当我打印listDa
浏览 5
提问于2021-10-11
得票数 0
2
回答
命名实体识别黄金标准语料库
的
样本大小
、
、
、
、
我有一个包含170部荷兰文学小说
的
语料库,我将在其中应用命名实体识别。为了评估现有的荷兰语NER标记器,我想在这个语料库
的
随机样本
中
手动标注命名实体-为此,我使用。在我对NER标记器
的
评估
中
,手动注释
的
随机样本
将作为“黄金标准”。我编写了一个
Python
脚本,在句子级别输出我
的
语料库
的
随机样本
。 我
的
问题是:就每本小说
的
句子数量而言,
随机
浏览 29
提问于2016-11-22
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame
Python获取对象属性的4中方法
Python 中获取迭代器长度的灵活方法
Python中如何获取Counter对象的键值及应用
Python中获取颜色RGB值的方法与应用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券