腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
10
回答
在大熊猫中
对
DataFrame
进行
混
洗
/置换
python
、
numpy
、
pandas
在
pandas
中按行或按列
混
洗
数据
帧
的
简单而有效
的
方法是什么?即
如何
编写一个函数shuffle(df, n, axis=0),该函数接受一个
数据
帧
、多个随机n和一个轴(axis=0是行,axis=1是列),并返回已经被随机n次
的
数据
帧
的
副本。编辑:关键是在不破坏
数据
帧
的
行/列标签<e
浏览 114
提问于2013-04-03
得票数 82
回答已采纳
1
回答
如何
对
pandas
数据
帧
的
每
一列
进行
混
洗
?
python
、
pandas
例如,我
的
文本文件如下所示 John Smith 19 Sandra Alexandru 44
如何
对
每
一列
进行
混
洗
?预期结果示例: Sandra Greelish 44John Alexandru 89 目前,我
的
代码如下所示: import
pandas
as pd df = pd.read_csv
浏览 13
提问于2021-09-27
得票数 1
回答已采纳
1
回答
如何
逐行随机洗牌熊猫
数据
帧
python
、
pandas
、
numpy
、
shuffle
我正在尝试按行而不是按列
对
pandas
数据
帧
进行
混
洗
。我有以下
数据
帧
:1 3 1 63 7 3 8 并且想要对df
进行
混
洗
以实现随机排列,例如:
浏览 0
提问于2017-12-21
得票数 3
回答已采纳
1
回答
如果值在两列之间“重叠”,则
对
pandas
DataFrame行
进行
混
洗
sorting
、
pandas
、
dataframe
、
intersection
、
overlap
我有以下熊猫
数据
帧
import
pandas
as pd df = pd.DataFrame({"first_element":[20, 125, 156, 211我
的
目标是(1)编写一个函数来查找所有重叠
的
“间隔”(两列first_element和second_element中
的
值)和(2)随机地
对
这些间隔
进行
混
洗
。目标(2)听起来非常棘手,因为需要分别
浏览 16
提问于2017-06-26
得票数 0
回答已采纳
1
回答
使用
数据
帧
中每行
的
最近点追加
pandas
行
python
、
pandas
我有一个有150行和4列
的
数据
帧
,我希望
每
一行都附加一个来自
数据
帧
的
向量,该向量与所有其他点(行)
的
距离最小。结果将是一个形状为150x8
的
数据
帧
。[concat
pandas
dataframe][1] `pd.concat([df1,df2], axis=1, join="inner")` Df2需要以这样一种方式
进行
df1重新排列,即df
浏览 25
提问于2021-07-24
得票数 0
6
回答
随机打乱numpy数组
的
每
一行中
的
项
python
、
arrays
、
numpy
,如下所示: [4, 5, 6],我想
对
每
一行
的
项目分别
进行
混
洗
,但不希望
每
一行
的
混
洗
都是相同
的
(就像在几个示例中一样,只是
混
洗
列
的
顺序)。例如,我需要如下所示
的
输出:
浏览 4
提问于2018-05-28
得票数 13
2
回答
我需要以相同
的
随机方式随机洗牌两个熊猫DataFrames
的
行
python
、
dataframe
、
random
、
shuffle
我有两个
数据
帧
,A和B,维度为MxN,我想随机
混
洗
哪些行。A和B具有相同
的
列名和索引。我知道
如何
使用df.apply(np.random.shuffle)方法在
每
一列
中打乱
数据
,但
每
列
的
排列方式不同。我希望如果A
的
第一行变成了洗牌后
的
第二行,B
的
第一行也变成了第二行,依此类推,我该怎么做呢?
浏览 10
提问于2018-07-25
得票数 1
1
回答
PySpark:随机化
数据
帧
中
的
行
python-3.x
、
apache-spark
、
dataframe
、
pyspark
、
apache-spark-sql
我有一个
数据
帧
,我想对
数据
帧
中
的
行
进行
随机化。我尝试通过给1
的
分数来采样
数据
,但这不起作用(有趣
的
是,这在
Pandas
中起作用)。
浏览 0
提问于2016-04-23
得票数 11
回答已采纳
3
回答
Python Dataframe:
对
行组
进行
混
洗
python
、
machine-learning-model
、
dataframe
在
数据
框中
混
洗
一组行
的
最佳方法是什么?对于模型
的
混
洗
训练集,需要这个。 例如,
每
10行作为一个单独
的
组
进行
混
洗
,或者有一些逻辑条件来创建单独
的
组并将它们作为一个组
进行
混
洗
。
浏览 1
提问于2018-08-10
得票数 1
1
回答
根据某个条件打乱
数据
帧
的
行数
python
、
pandas
我有一个包含ID列
的
dataframe,我想
对
只有特定ID
的
行
进行
混
洗
。我
的
数据
帧
示例如下: -----------------------------------------------------------red 2 melon yellow 我尝试了下面的方法,而不是像我在df.
浏览 18
提问于2019-12-18
得票数 1
回答已采纳
2
回答
如何
对内存中
的
数据
进行
重新排序以优化缓存访问?
c#
、
performance
、
caching
我想
混
洗
一个大型
数据
集(类型为List<Record>),然后
对
其
进行
多次迭代。通常,
混
洗
列表只会混
洗
引用,而不是
数据
。由于频繁
的
缓存丢失,我
的
算法
的
性能受到了极大
的
影响(3倍)。我可以对
混
洗
后
的
数据
做一个深度拷贝,使其
对
缓存友好。然而,这将使内存使用量翻倍。 有
浏览 2
提问于2014-08-01
得票数 1
1
回答
在DataFrame中
混
洗
部分行
python
、
dataframe
、
shuffle
我以前遇到过一些关于
如何
对
行值()
进行
混
洗
的
帖子。但对我来说,我想知道
如何
处理这些行
的
一部分,而不是这些行
的
全部。我在这里做了一个快速
的
数据
帧
:有没有办法重新处理,使
每
一行
的
B、C和D列中
浏览 0
提问于2016-06-01
得票数 2
2
回答
Spark -
如何
在列
的
基础上以最小
的
混
洗
重新划分
数据
帧
?
apache-spark
、
apache-spark-sql
我们有多个
数据
帧
。 其中一个
数据
帧
是主
数据
帧
,它使用左-外连接与其他
数据
帧
连接。所有这些
数据
帧
都连接在4列上(比如col1、col2、col3、col4)。为了减少
数据
混
洗
,目前我们正在对4个连接列上
的
所有
数据
帧
进行
重新分区,然后连接这些
数据
帧
(从左到外)。
浏览 2
提问于2019-02-08
得票数 2
1
回答
Keras课程学习- change shuffle方法
keras
、
deep-learning
、
shuffle
我想改变我们在Keras中
混
洗
训练
数据
的
方式。传统上,我们在每个时期
对
样本
进行
混
洗
,然后批量处理并拟合模型。现在我想先
对
样本
进行
批量处理,然后
对
这些“批次”
进行
混
洗
(每个批次中
的
所有样本都不能
进行
混
洗
)。原因是我根据标准(课程学习)订购了所有样本,我希望保留这样
的</
浏览 16
提问于2020-07-19
得票数 0
1
回答
从训练和测试集创建线性模型
r
我有一个
数据
集,我首先
对
其
进行
了
混
洗
,然后将其划分(k倍)为一个
数据
帧
,该
数据
帧
是训练集(67个观察值)和一个表示测试集(10个观察值)
的
数据
帧
。 我
如何
使用训练集在R中建立线性模型来预测测试集?
浏览 1
提问于2017-03-07
得票数 0
1
回答
对
pandas
中
的
单列
进行
固定百分比
的
混
洗
python
、
pandas
、
dataframe
、
scikit-learn
、
shuffle
我正在尝试将
pandas
中
的
单列以固定
的
百分比
进行
混
洗
。总迭代次数= 30)在每次迭代中使用Sklearn utils shuffle函数。但它不会改变原始
数据
帧
。有没有办法将此操作应用于原始
数据
帧
?或者还有其他方法吗?谢谢。
浏览 23
提问于2020-11-10
得票数 0
1
回答
策略梯度:为什么
混
洗
数据
会导致性能下降?
python
、
neural-network
、
reinforcement-learning
以上是代理在gym环境LunarLanderContinuous-v2上运行时
每
100集
的
平均得分。橙色和蓝色线条是代理将过渡顺序馈送到策略梯度算法(例如,ppo)时
的
结果,而红线是代理在将收集
的
过渡馈送到算法之前
对
收集
的
过渡
进行
打乱时
的
结果。我不明白为什么简单地对
数据
进行
混
洗
会产生如此大
的
不同。据我所知,神经网络假设输入
数据
是IID,因此DQN
浏览 15
提问于2019-02-10
得票数 0
3
回答
如何
在不占用太多内存
的
情况下
对
大型csv文件
的
行
进行
混
洗
,并将结果写入新
的
csv文件?
python-3.x
、
csv
因此,如果我有一个csv文件,如下所示: A M C FUser GenderC F B F 我
的
问题是,我不知道
如何
随机选择行,并确保从原始csv文件中获得
每
一行。作为参考,我
的
csv文件大约为3 3gb。如果我将整个
数据
集加载到
数据
帧
中,并使用随机包
对
其
进行
浏览 4
提问于2019-09-17
得票数 2
1
回答
如何
根据分类列
对
pandas
数据
帧
进行
混
洗
python
、
pandas
、
dataframe
假设我有一个可以按person列(A、B、C、D等)分组
的
数据
帧
,每个人都有一定数量
的
记录。问题是,我
如何
才能在不改变每个组内
的
顺序
的
情况下
对
这些人
进行
洗牌?
浏览 0
提问于2017-07-26
得票数 2
2
回答
在python中数组不可调用"'numpy.ndarray‘对象不可调用“
python
、
numpy-ndarray
我正在研究一个神经网络,当我试图
对
两个numpy.ndarray
进行
混
洗
时,我得到了这个错误。我尝试重新检查shuffle函数格式,但找不到任何错误。
浏览 0
提问于2018-12-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何只用一行代码让 Pandas 加速四倍?
如何只用一行代码让Pandas加速四倍?
pandas入门指南
python数据分析之pandas二
pandas系列学习(五):数据连接
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券