腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
将
数据
集
分组
为
2个
样本
时
获取
KeyError
python
、
pandas
、
statistical-test
、
data-wrangling
bikesharing_data‘是pandas对象的名称,'workingday’是该
数据
框中列的名称。导师想要将
数据
集
分成两个
样本
,并将“workingday”分成(0,1)组。workingday'] == 1)] sample_02 = bikesharing_data[(bikesharing_data['workingday'] == 0)] 我的问题是,如果我按如下方式划分
样本
: sample_01 = bikesharing_data['
浏览 8
提问于2020-04-21
得票数 0
回答已采纳
1
回答
fit方法中的组元- sklearn
python
、
machine-learning
、
scikit-learn
当我发现fit方法
时
,我试图
在
Sklearn中使用
分组
数据
运行交叉验证有一个组参数定义
为
: 组:数组样,形状(n_samples,),可选的组标签使用的
样本
,同时
将
数据
集
分裂成火车/测试
集
。这是否与将我的
数据
与
分组
数据
的其他迭代器(GroupKFold、LeaveOn
浏览 1
提问于2018-03-15
得票数 1
1
回答
在
训练NN
时
,
数据
加载器是如何在大型
数据
集中工作的?
data
、
bigdata
在
训练神经网络
时
,你通常如何组织大型
数据
集
以便于加载?我有一个庞大的
数据
集
,无法装入内存,它由200000个
样本
组成,10k个
样本
存储
在
分组
文件中。总的来说,这大约是50 of的
数据
。我可以
将
分组
分开以生成200000个单独的文件,但我不确定这是否是正确的操作过程,因为系统
在
培训
时
需要对文件系统进行多次调用。 训练大量
数
浏览 0
提问于2020-05-05
得票数 2
1
回答
如何绑定到过滤或
分组
的Sketchflow
样本
数据
?
c#
、
code-behind
、
sketchflow
、
sample-data
我已经
在
一个Sketchflow原型中创建了一些
样本
数据
作为StaticResource (这是一个Silverlight项目)。
在
将
样本
数据
绑定到网格视图进行显示之前,我希望按
样本
数据
进行筛选或
分组
。 我如何
获取
C#代码后台文件中的
样本
数据
,以便在显示之前对其进行过滤或
分组
?
浏览 5
提问于2010-08-20
得票数 1
回答已采纳
1
回答
分层抽样变量选择
bigdata
、
sampling
、
distribution
我试图
在
R中进行分层抽样,从我的
数据
中抽取
样本
,其中一个参数是组,它从保持
数据
集
的相同初始分布取变量名到
样本
。 是否
将
响应作为
分组
变量包括在内是常见的,包括/排除它意味着什么?
浏览 0
提问于2017-11-08
得票数 2
1
回答
Tensorflow返回带有tf.data.Dataset对象的ValueError,但是可以很好地使用np.array
python-3.x
、
tensorflow
、
tensorflow2.0
、
tensorflow-datasets
我正在使用Kaggle
数据
集
开发一个数字分类器模型:https://www.kaggle.com/c/digit-recognizer/data?select=test.csv 当使用np.array对象拟合模型
时
,它工作得很好,但我不能传递tensorflow ds对象。下面是我使用ds对象进行训练/验证
数据
的代码: import pandas as pdimport tensorflow as tf from tenso
浏览 10
提问于2020-07-06
得票数 0
回答已采纳
2
回答
在
sklearn (python2.7)中创建带有
分组
约束的训练、测试和交叉验证
数据
集
?
python-2.7
、
numpy
、
machine-learning
、
data-mining
、
scikit-learn
在用Python创建列车、测试和交叉验证示例
时
,我看到默认方法
为
-: import csv找到A的所有唯一值,将其表示
为
我的示例,我现在
将
样本
分发到-st列、mediate&cv& test ->中,然后
将
这些文件中"A“值的其余行放在其中的每个
浏览 4
提问于2013-09-18
得票数 4
1
回答
在
oracle中跨多列的多行中选择非空值
sql
、
oracle
、
group-by
、
duplicates
、
notnull
例如,如果我们有一个如下所示的
样本
数据
集
正如您在上面简化的oracle sql
数据
集中看到的那样,对于每个电子邮件地址,有多个记录的sign_up_page、last_sign_up_page、supplimental_data、last_sign_up_timestamp和last_sign_up_widget的值
为
空值。但是对于特定的电子邮件地址,所有这些列
数据
将
只有一个非空值。 可以通过选择相应列
数据
浏览 0
提问于2018-01-16
得票数 0
1
回答
一种用于比较200k字符串的
数据
结构
python
、
data-structures
、
string-matching
我希望相似的字符串
在
集合中的数量非常少。请帮助我们实现高效的
数据
结构。我不想调用查找“相似性”~(200k*100k)次的函数。欢迎任何建议,如预处理字符串的技术,高效的
数据
结构。谢谢。
浏览 2
提问于2012-12-27
得票数 3
回答已采纳
1
回答
如何链接SSRS表页脚中的多个
数据
集
?
c#
、
sql
、
reporting-services
我
将
2008与C#一起用于ASPX网页。然后说我把我的桌子按食物
分组
。下面是我关于如何在SSRS中这样做的最初想法: 我想我可以有如下
数据
集
:
浏览 4
提问于2013-06-18
得票数 0
回答已采纳
1
回答
在
elasticsearch中从
样本
中选择
数据
集
elasticsearch
、
elasticsearch-aggregation
我有一个
数据
集
,有1000个日期,跨越一个月。我想根据这个日期字段进行聚合,但是只有很少的
样本
被间隔(比如星期)分隔开。PS :我不想在这里使用日期直方图,因为它将
数据
分组
为
给定的间隔。因此,对于上面的例子,它形成桶从1-7,8-15等等。 我查看了示例聚合,它需要提供一个脚本。我不知道应该如何编写脚本,以
获取
样本
并将这些
样本
提供给子聚合。
浏览 1
提问于2017-02-01
得票数 0
回答已采纳
1
回答
如何在Tensorflow 2中有效地进行
数据
增强?
tensorflow
、
data-augmentation
当我听说
数据
增强
时
,我学到的定义是:“这是一种
将
当前
数据
集
的一些
样本
(如旋转、翻转、亮度等)转换为
数据
集
的技术。” 但在该教程中,他们只是用转换后的
样本
覆盖当前
数据
集
,而不是添加新
数据
.还是我错了?这样做的正确方法不是
获取
N个随机
样本
,转换它们并将它们添加到
数据
集中?
浏览 0
提问于2022-07-18
得票数 1
回答已采纳
4
回答
使用ORS、NR、FS、RS的awk命令说明
linux
、
awk
我有一个
样本
数据
集
:246awk 'ORS=NR%3?我不能把各个部
分组
合在一起。 ?
浏览 1
提问于2019-05-06
得票数 8
回答已采纳
4
回答
如何以编程方式捕获哪个命令
在
try块上失败
python
我正在尝试从JSON中
获取
一些
数据
。我不想要API返回的所有
数据
,所以我编写了一个方法来读取所有
数据
,并返回带有相关字段的字典。但是,有时会丢失一些
数据
,我希望用下划线替换缺少的字段。这种方法的
样本
是这样的; 'foo': data['foo'], } 如果
数据
中缺少字段,则该字段
将
遍历
Key
浏览 4
提问于2016-10-02
得票数 1
回答已采纳
1
回答
SSAS维度设计-新客户与现有客户
ssas
、
cube
我正在修改现有的多维
数据
集
。其中一个多维
数据
集
用于
获取
客户和销售
数据
,例如Q1 2012按客户划分的销售额等。我希望
在
客户创建日期
为
新客户或现有客户群添加
分组
,如下所示:------- Customer Name 1 1000Customers 5500 Customer
浏览 0
提问于2012-06-06
得票数 1
1
回答
训练完成后
在
神经网络中测试
数据
的代码
python
、
numpy
、
testing
、
neural-network
、
training-data
但我不知道如何测试
数据
集
.我的
数据
集
包括350条条目,其中一半用于培训,另一半用于测试。有人能帮我看看测试模块中的代码是什么样子吗?神经网络的结构:它有三个隐藏层,有34个列谢谢import numpy as np X = X = np.array([[float(cell)
浏览 5
提问于2016-06-15
得票数 2
回答已采纳
1
回答
X秒采样间隔不均匀
python
、
time-series
、
clustering
、
predictive-modeling
我有以下规范的
数据
集
:每个
样本
是来自传感器的8秒
数据
,分辨率
为
4ms。例如,我
在
第一天采集了5个
样本
,然后
在
第5天采集了10个以上的
样本
等等。我想要对
数据
进行聚类,以检查是否可以从单个8秒的
样本
中推断出机器的操作模式。此外,我还想衡量一年来组件的性能,以便进行预测维护。 目前,我想使用自组织映射进行聚类。我是这门
数据<
浏览 0
提问于2021-04-29
得票数 0
回答已采纳
1
回答
实现半控制随机
集
的最好的SAS方案是什么?
random
、
sas
我所使用的场景是创建一个宏,该宏接收
数据
集
并生成随机分层
样本
,分层应该是由列状态进行的,
在
创建随机
样本
时
,该列状态还需要相等的表示总数(如果可能)。所需
样本
的大小有一些我们必须遵守的规则,这些规则是: 如果总
数据
集
大小
为
<= 50,则让
样本
大小=整个
数据
集
,如果总
数据
集
大小介于51到500之间,则让
样本
大
浏览 0
提问于2021-07-08
得票数 1
回答已采纳
1
回答
如果Keras steps_per_epoch参数设置
为
值小于(num )。样品/批次大小)
在
每个时代使用的样品是否总是相同的?
python
、
keras
我想知道是否
将
Keras steps_per_epoch参数设置
为
小于(
数据
集
/批处理大小中的
样本
数)的固定值,
将
始终在
数据
集中使用相同的
样本
(从
样本
0到
样本
(steps_per_epoch*batch_size)-1),从而减小训练
集
的有效大小,还是
在
每个时代都从大小batch_size的训练
集
(不替换)中提取steps_per_epoch随机
浏览 2
提问于2020-08-22
得票数 2
回答已采纳
1
回答
PySpark -截断
将
时间序列
分组
到仅24小
时
python
、
apache-spark
、
pyspark
我有200,000,000行标签(按上一级
分组
),其中包含时间序列
数据
。下面是一个
数据
示例:Tag_1 Engine 2021-08-09 01:01:04 0这个
数据
非常大。如何过滤每个Group's Tags,以便只有最近24小
时
的非空
数据
可供分析?为了澄清,对于每个标签,我只需要过
浏览 3
提问于2021-08-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
探“云”指南|科学与美观:花瓣图操作指南
基于多标签SVM的DNS隧道分类
分组SVR和KNR的单帧图像超分辨
美团外卖特征平台的建设与实践
Python基础知识|集合(set)基本操作和常用
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券