腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
从
R
数据
帧
的
两
列
中
联合
采样
?
r
、
shuffle
、
sample
我有一个有4
列
的
数据
框。我正在尝试将
数据
帧
的
两
列
混洗在一起,以使这
两
列
始终相关。 我尝试过“sample”函数,但它仅限于
数据
帧
的
一
列
。
浏览 6
提问于2019-10-29
得票数 0
1
回答
Scala Spark :在Spark中有没有datafu.pig.sampling.SampleByKey
的
替代品?
scala
、
apache-spark
、
apache-spark-sql
、
apache-pig
SampleByKey
的
采样
方法是将键转换为散
列
,从中派生一个双精度值,然后根据提供
的
概率对其进行测试。密钥派生
的
双精度值在0到1之间均匀分布,代码为。具有相同键
的
所有行都以这种方式进行
采样
。我有一个Dataframe,它是通过对多个dataframe执行
联合
操作而形成
的
(它们都有相同
的
模式)。我感兴趣
的
是,每个单独
的
数据
帧
都有一个column
浏览 0
提问于2020-06-03
得票数 0
5
回答
如何
组合
两
个
数据
帧
?
python
、
pandas
我用
的
是熊猫
数据
帧
。我有一个初始
数据
帧
,比如D。我
从
其中提取了
两
个
数据
帧
,如下所示:B = D[D.label != k] 我希望将A和B结合起来,这样我就可以将它们作为一个DataFrame,类似于
联合
操作。
数据
的
顺序并不重要。但是,当我们
从
D
中
采样
A和B时,它们会保留来自D
的
浏览 1
提问于2012-10-12
得票数 158
回答已采纳
1
回答
从
数据
中
创建100个样本
的
R
函数
r
、
sample
我需要创建100个独立
的
样本,以便每个样本有一个客户
的
单一观察。存在具有重复值
的
列
c_id。每个样本都应该有客户
的
单一记录。这是我尝试过
的
代码 N_Sample<-100 k=sample(1:length另外,在我
的
数据
集中有一
列
"Balance“。对于每个样本,我需要计算所有100个样本
浏览 26
提问于2020-07-18
得票数 0
1
回答
对多
列
熊猫进行重
采样
pandas
、
scikit-learn
如何
对多个
列
的
数据
帧
进行重
采样
以获得新
的
统计
数据
? 例如,我有一个以秒为索引
的
dataframe,有
两
列
(数量、数量),我想将()重
采样
为分钟,并基于数量*数量创建一个新
列
。
浏览 1
提问于2017-01-10
得票数 0
1
回答
合并具有不同模式
的
两
个地块文件
python
、
dataframe
、
parquet
、
databricks
我有
两
个拼图文件,拼花A有137
列
,拼花B有110
列
。拼图文件包含表
的
整个历史记录。因此,拼图A拥有表
的
整个历史记录
的
所有字段。拼图B是我今天拉入
的
所有值,删除了17
列
。我想把拼花A和拼花B结合起来,但它们没有相同数量
的
柱子。所以每次都会失败。 我尝试过mergeSchema,但失败了。是否可以将缺少
的
列
添加到拼接B并添加空值。那就加入工会吧?
浏览 19
提问于2018-09-06
得票数 0
1
回答
对具有相同代码(ID)
的
条目进行重
采样
r
、
resampling
在
R
中
,我正在尝试对我
的
数据
集进行重
采样
。
数据
库A在第一
列
包含一些代码(整数),每一行
的
特征如下:一些代码在第一
列
中
重复。我想从第一
列
开始对随机代码进行重
采样
,并创建一个新
的
矩阵或
浏览 23
提问于2017-01-26
得票数 2
回答已采纳
1
回答
在dataframe
中
插入可变行数
r
、
dataframe
、
missing-data
我想要一些关于
如何
在
数据
帧
中
插入空行
的
帮助。插入
的
数量将根据其他
两
列
中
存在
的
数据
而有所不同。例如,我希望填充表示站点
的
行,这些站点在特定日期内未进行
采样
。每个站点有10个副本。假设我有几天
的
时间,8个站点中只有1个站点进行了
采样
,因此80个站点中缺少70行(7个站点x 10个重复)。在其他日子里,我在一个站点中只有一个丢失<em
浏览 0
提问于2015-03-07
得票数 0
4
回答
基于
列
中
的
值
的
Pandas
数据
帧
示例
pandas
、
dataframe
我有一个很大
的
数据
帧
,我想根据target
列
值上
的
值对其进行
采样
,该值为binary : 0/1 我想提取在"target“
列
中有0和1
的
相同数量
的
行。我在考虑使用pandas
采样
函数,但不确定
如何
根据target列为
数据
帧
声明我想要
的
两
个类
中
相同数量
的
样本。我在考虑使用这
浏览 52
提问于2019-05-18
得票数 10
回答已采纳
1
回答
如何
根据
列
的
不同值对
数据
框行进行统一
的
下
采样
?
python
、
pandas
、
dataframe
、
downsampling
我正在尝试对
数据
帧
行进行下
采样
,以便创建更小
的
数据
帧
。让我们假设我们
的
dataframe有几列,并且每一
列
都有预定义
的
分类值。
如何
确保每个不同
的
类别值都有机会出现在新
的
重
采样
数据
帧
中
?'B':'f', 'C':'i'},{'
浏览 3
提问于2019-09-03
得票数 1
1
回答
对
数据
帧
中
的
向量进行
采样
,并引用到pandas
中
的
另一个
数据
帧
中
python
、
pandas
、
dataframe
、
sample
我被我想做
的
事情卡住了。2/1/2022 02:00 **0.67**我正在尝试
采样
不同
的
行向量,并将它们
从
第一个
数据
帧
转置到第二
浏览 3
提问于2021-02-18
得票数 0
回答已采纳
2
回答
在spark scala
中
,为
数据
帧
中
的
每个组
采样
不同数量
的
随机行
scala
、
apache-spark
、
apache-spark-sql
、
spark-dataframe
目标是为每个组在
数据
帧
中
采样
(不替换)不同数量
的
行。特定组要
采样
的
行数在另一个
数据
帧
中
。 示例: idDF是要从中
采样
的
数据
帧
。组由ID列表示。
数据
帧
planDF指定要为每个组
采样
的
行数,其中"datesToUse“表示行数,"ID”表示组。"t
浏览 25
提问于2018-03-02
得票数 3
回答已采纳
1
回答
重复行
的
随机抽样
r
、
subset
、
sampling
我有一个包含2
列
的
数据
帧
:
列
1是ID,
列
2是与每个ID关联
的
值(总共59行)。1
列
随机
采样
并将关联值保留在第2
列
的
唯一方法是对行进行
采样
。我需要随机
采样
50 x 1行、50 x 2行、50 x 3行、50 x 4行等等,直到59行。理想情况下,每个样本集输出为一个
数据
帧
。因此,我最终得到了59组随机
采样
浏览 1
提问于2018-06-04
得票数 0
1
回答
如何
找出
R
中
缓冲区内
的
点?
r
我有
两
个
从
txt文件导入
的
数据
帧
--
采样
点和站点位置。
采样
点
数据
帧
346449.30 576369.65 86.93346449.29 576368.1786.59346449.61 576363.59 84.99 346449.50 576363.54 81.3
浏览 1
提问于2015-01-19
得票数 1
回答已采纳
1
回答
统一Spark
中
具有不同
列
数
的
两
个表
sql
、
apache-spark
如何
联合
包含不同
列
数
的
两
个
数据
帧
A和B,并为
数据
帧
A和B
中
不常见
的
列
获取空值?我可以看到spark
的
unionAll不支持此操作,并抛出以下错误 org.apache.spark.sql.AnalysisException: Union can only be performed
浏览 0
提问于2016-08-04
得票数 0
1
回答
跨多个文件夹循环重
采样
多个CSV文件
中
的
日期时间并使用自动生成
的
文件名导出
的
步骤
python
、
csv
、
datetime
、
export-to-csv
我有许多
数据
帧
(csv文件)位于我
的
计算机上我
的
文档
的
各个文件夹
中
。所有csv文件都具有相同
的
列
数,其中每
列
的
名称相同且顺序相同,但是文件
中
的
数据
行数不同。所有文件
的
第一
列
都是"Datetime“,其中"YYYYMMDD HH:MM:SS”记录在
数据
行
中
。 我想重新
浏览 2
提问于2016-11-22
得票数 0
2
回答
Spark
联合
列
顺序
apache-spark
、
pyspark
、
apache-spark-sql
、
pyspark-sql
我最近在Spark遇到了一些奇怪
的
事情。据我所知,根据spark dfs
的
基于
列
的
存储方法,
列
的
顺序实际上没有任何意义,它们就像字典
中
的
键。| 1| asd|| 3| f1f||asda| 2|
浏览 3
提问于2019-07-09
得票数 26
回答已采纳
1
回答
使用相似字符串Python连接
两
列上
的
两
个
数据
帧
python
、
merge
我有
两
个
数据
帧
(df1和df2),我想使用
两
列
“州”(即阿肯色州)和“县”(即
联合
)进行左合并。(
联合
是阿肯色州
的
一个县)。df1和df2需要匹配“州”和“县”,但df2
的
县名称包含df1县名称(即伍德蒙特县区)
中
找不到
的
附加字符串(即伍德蒙特县自治市)。
如何
才能将这
两
个具有不同县表示
的
数据
帧
左合并?我有很多
浏览 15
提问于2020-12-05
得票数 0
1
回答
将具有嵌套不同模式
的
两
个
数据
帧
合并
apache-spark
、
pyspark
valueContainsNull = true) |-- hour: string (nullable = false) 注意不同之处-在第二个
数据
帧
中
没有
如何
将这
两
个
数据
帧
合并在一起?我知道这
两
个模式必须是相同
的
才能
联合
。添加fooId或删除fooId
的
最好方法是什么?(由于模式
的
结构而不是很简单)进行
浏览 0
提问于2018-11-27
得票数 1
3
回答
如何
从
两
列
中
的
一
列
中
采样
细胞?
r
我想在我
的
数据
帧
中
定义一个new.column。new.column
从
另外
两
列
中
的
一
列
获取值。如果其他
列
在同一行
中
,则new.column
的
给定单元格应该仅对这些
列
中
的
单元格进行
采样
。我想要
的
:--
浏览 10
提问于2019-07-10
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Excel表格中快速的进行两列数据的互换?
【WPS神技能】如何在WPS-Excel表格中批量查找两列数据的不同?
【WPS神技能】如何在WPS-Excel表格中的两列数据里快速找相同内容?
音视频入门基础(一)
集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券