腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
根据
另一
列
中
的
值
计数
从
Pandas
Dataframe
中
采样
数据
python
、
pandas
、
sample
我有一个大约40万个观察
值
的
数据
框架。我想
根据
“state”
列
中
每个状态
的
数量对50,000个观察
值
进行
采样
。因此,如果来自TX
的
所有观测
值
中有5%,那么2500个样本应该来自TX,以此类推。我尝试了以下几种方法: import
pandas
as pd df.sample(n=50000, weights = 'state', random_state = 1
浏览 14
提问于2021-08-10
得票数 0
回答已采纳
0
回答
在一定条件下使用count方法对
数据
帧进行重
采样
python-3.x
、
pandas
我在试着
从
数据
框
中
重新
采样
数据
。
列
具有不同类型
的
数据
。对于其中一
列
,我想计算该
列
的
值
大于0
的
行数。一个小示例如下所示:import numpy as np df = pd.
DataFrame
(data={'Date': pd.date_range('201
浏览 4
提问于2018-07-10
得票数 4
回答已采纳
0
回答
基于
计数
列对
pandas
数据
帧进行下
采样
python
、
pandas
我有一个类似下面的成千上万
的
数据
框架,虽然要大得多(1000000行,100
列
)。,并生成一个新
的
数据
帧,这样
计数
的
和应该只等于N。这意味着我想基于作为权重
的
计数
值随机
采样
,并用这个新
的
重新
采样
的
数据
生成一个新
的
数据
帧,这样
计数
的
和就是N。 相对比例应该保持大致相同,并且重新
浏览 6
提问于2018-07-11
得票数 4
回答已采纳
1
回答
pandas
中使用概率
列
的
随机抽样行
python
、
pandas
、
random
我正在使用python和
pandas
从
数据
帧
中
随机抽取样本。我
的
数据
帧如下所示: 第一
列
包含时间,第二
列
是平均速率,第三
列
是1-sigma,第四
列
是与该行描述
的
事件相关
的
概率。 ? 我知道我可以使用下面的代码来绘制加权样本: random=df.sample(n=100000, replace=True, weights='P>0', axis=0)
浏览 24
提问于2020-04-24
得票数 1
回答已采纳
3
回答
如何
在for循环中更新熊猫
数据
中
的
值
?
python
、
pandas
、
dataframe
我正在尝试创建一个
数据
框架,可以在每次迭代之后存储变量coeff
值
。我能够在每次迭代之后绘制这个图。但是当我试图在每次迭代之后在
数据
帧
中
插入
值
时。31680,\n dtype=‘in 64’,length=28512]在
列
中
) for trai
浏览 7
提问于2020-02-09
得票数 0
1
回答
使用旋转
的
xlabels在Seaborn Python
中
绘制条形图
python
、
matplotlib
、
bar-chart
、
seaborn
在没有任何统
计数据
的
情况下,
如何
在Seaborn
中
绘制简单
的
条形图?
数据
集仅仅是名称和
值
。import
pandas
我想将其绘制为
浏览 1
提问于2016-09-26
得票数 4
回答已采纳
1
回答
如何
根据
特定
列
中
的
每个空
值
从
数据
帧
中
删除行?
python
、
pandas
、
dataframe
如何
根据
特定
列
中
的
每个空
值
从
数据
帧
中
删除行? 假设我有一个
dataframe
,它有三
列
a、b、c,所有
列
都可以有null
值
,但我只想droprows
列
b有null/NaN
的
地方。我
如何
在
pandas
数据
帧
中
做到这一点?
浏览 5
提问于2018-02-12
得票数 0
回答已采纳
4
回答
要列出
的
Pandas
DataFrame
列
python
、
pandas
我正在
根据
满足
的
另一
列
中
的
条件从一
列
中提取
数据
的
子集。 look
浏览 4
提问于2014-05-20
得票数 188
1
回答
对特定
列
中一行
的
特定整数值进行
计数
python
、
pandas
、
dataframe
、
count
我有12
列
的
pandas
dataframe
,每
列
的
值
都是
从
0到12随机
的
。我想创建包含这些特定
值
的
计数
的
新
列
。例如,newvar1将在每一行
中
包含
计数
“1”。
另一
个新
的
结果变量将包含某些特定
列
中
某个特定
值
的</e
浏览 11
提问于2019-08-21
得票数 1
4
回答
基于
列
中
的
值
的
Pandas
数据
帧示例
pandas
、
dataframe
我有一个很大
的
数据
帧,我想
根据
target
列
值
上
的
值
对其进行
采样
,该
值
为binary : 0/1 我想提取在"target“
列
中有0和1
的
相同数量
的
行。我在考虑使用
pandas
采样
函数,但不确定
如何
根据
target列为
数据
帧声明我想要
的
两个类
中</
浏览 52
提问于2019-05-18
得票数 10
回答已采纳
1
回答
使用
Pandas
数据
框
如何
使用多条件随机选择行
数据
python
、
pandas
、
random
我有一个包含
列
NDVI、Lat、Long、Group、column & Taluka
的
数据
集。 我想在每个taluka
中
随机选择10个村庄,每个村庄随机选择5行
数据
。但是我坚持选择随机函数。因此,在taluka(块)
中
,我想选择50个
数据
值
,但条件是选择10个村庄,每个村庄至少需要5个条目,并且基于"Group“
列
,概率比例概率选择5个点。如果村庄XYZ在组中有70%面积,则将选择n=5 *0.70 =3.5Samp
浏览 2
提问于2019-11-19
得票数 0
1
回答
Scala Spark :在Spark中有没有datafu.pig.sampling.SampleByKey
的
替代品?
scala
、
apache-spark
、
apache-spark-sql
、
apache-pig
SampleByKey
的
采样
方法是将键转换为散
列
,从中派生一个双精度
值
,然后
根据
提供
的
概率对其进行测试。密钥派生
的
双精度
值
在0到1之间均匀分布,代码为。具有相同键
的
所有行都以这种方式进行
采样
。我有一个
Dataframe
,它是通过对多个
dataframe
执行联合操作而形成
的
(它们都有相同
的
模式)。我感兴趣
的
是,每个单独
的<
浏览 0
提问于2020-06-03
得票数 0
1
回答
如何
循环从一个
数据
到
另一
个,以
计数
某些词
的
发生?
python
、
dataframe
、
count
、
combinations
、
find-occurrences
我有两个dataframes,df1包含一个包含所有可能组合
的
列
,df2包含一个具有实际组合
的
列
。我想在df1
中
创建第二
列
,循环遍历df2并对
值
进行
计数
。因此,如果df1有一行'A,C‘和'A,B,C’,以及'A,C,D‘
的
df2行,我希望代码在新
列
中
添加一个2。 当然,如果这里不需要循环,那么其他
的
东西也可以。我添加了一个excel示例,现在我想在有
浏览 3
提问于2022-12-04
得票数 0
1
回答
熊猫重新
采样
处理丢失
的
数据
python
、
pandas
我正在使用
pandas
来处理有缺失
值
的
月度
数据
。我希望能够使用重
采样
方法来计算年度统
计数据
,但不会丢失
数据
。以下是一些用于演示
的
代码和输出:import numpy as npdf = pd.
DataFrame
浏览 1
提问于2014-06-17
得票数 5
1
回答
PySpark:随机化
数据
帧
中
的
行
python-3.x
、
apache-spark
、
dataframe
、
pyspark
、
apache-spark-sql
我有一个
数据
帧,我想对
数据
帧
中
的
行进行随机化。我尝试通过给1
的
分数来
采样
数据
,但这不起作用(有趣
的
是,这在
Pandas
中
起作用)。
浏览 0
提问于2016-04-23
得票数 11
回答已采纳
1
回答
按日期突出显示python绘图中
的
最大点点
python
、
pandas
、
matplotlib
、
attributes
我知道这个问题真的很接近其他许多已回答
的
问题,但之前所有的答案都给了我相同
的
回溯问题。 我有一个简单
的
时间序列,我试图突出最大
值
。我在操作
Pandas
Dataframe
以获得用于在图形上绘制
的
最大y
值
时遇到了问题。我想我就快完成了,但是我认为pd.read_csv导入
的
parse_dates参数干扰了我
的
索引。当我导入dataset时,我有一个datetime
列
和一个wind_speed
列
浏览 1
提问于2018-07-09
得票数 1
3
回答
在两个数组
中
查找重复
的
值
,Python
python
、
pandas
、
numpy
我想创建一个有三
列
的
pandas
数据
帧,col1:来自数组A
的
值
,col2:来自数组B
的
值
,col3:标签为“唯一”或“重复”
的
字符串。在每个数组
中
,ID:s是唯一
的
。 数组
的
长度不同。a = np.array([1, 2, 3, 4, 5])pd.
DataFrame
({'a'
浏览 80
提问于2021-01-28
得票数 2
回答已采纳
1
回答
向
pandas
DataFrame
添加新
列
时
的
NaN
值
python
、
pandas
、
dataframe
、
nan
我正在尝试在一个
pandas
DataFrame
中生成一个新
列
,该
列
与
另一
个
pandas
DataFrame
中
的
值
相等。当我尝试创建新
列
时,我只得到新
列
值
的
NaNs。首先,我使用API调用来获取一些
数据
,'mydata‘
DataFrame
是按日期索引
的
一
列
数
浏览 1
提问于2014-10-07
得票数 26
回答已采纳
1
回答
对某一
列
中
的
值
进行
计数
,条件是
另一
列
python
、
pandas
我有一个
数据
集,我正在尝试计算
列
中
1
的
数量,并
根据
另一
列
对它们进行分组,然后将其作为
值
返回(在类中使用)。示例
数据
Current = {'Item': ['Chocolate', 'Chocolate', 'Sweets', 'Chocolate', 'Sweets
浏览 8
提问于2020-02-28
得票数 0
回答已采纳
1
回答
为
pandas
数据
帧
的
每一行随机抽样非空
列
值
python
、
pandas
、
dataframe
、
random
、
sample
对于每一行,我想随机抽样k个对应于非空
值
的
列
索引。如果我从这个
数据
帧开始, A = pd.
DataFrame
([ [np.nan, 2, np.nan, 7],]) 0 1 2 31 NaN 2.0 NaN 7.0 2 4.0 8.0 9.0 NaN 如果我想为每一行随机
采样
2个非空
值
,<
浏览 7
提问于2021-07-30
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(三):DataFrame
肝了3天,整理了90个Pandas案例
每天读一本:利用Python进行数据分析
用Python玩转统计数据:取样、计算相关性、拆分训练模型和测试
手把手教你做一个“渣”数据师,用Python代替老情人Excel
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券