腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6767)
视频
沙龙
2
回答
我
根据
股票代码
的
首字母
使用范围
划分
策略
对
数据
进行
划分
,
导致
划分
结果
不均匀
、
、
我
根据
股票代码
的
首字母
使用范围
划分
策略
对
数据
进行
划分
,
导致
划分
结果
不均匀
。如何解决不均衡问题?
我
需要
根据
两个维度
对
股票
的
出价
数据
进行
划分
:日期和
股票代码
。如果仅
根据
<
浏览 32
提问于2021-07-23
得票数 0
1
回答
按地理位置
划分
的
MongoDB组
我
希望使用聚合查询
对
MongoDB中
的
地理空间
数据
进行
分组。
我
有一个包含大约100万份文档
的
集合,其中有一个带有2D Sphere索引
的
geojson。
我
能够使用一个$geoNear查询(每次一个网格
的
每个方格)循环遍历预定
的
多边形,以得到我想要
的
结果
,但是效率很低。
我
想以某种方式查询一次,并以lat/long
对
<em
浏览 3
提问于2022-01-04
得票数 0
1
回答
与潘达斯
的
二维联调
、
、
因此,
我
有两组特性,
我
希望
对
它们
进行
存储(分类),然后组合起来创建一个新特性。这与将坐标
划分
为地图上
的
网格没有什么不同。问题是,这些特性
的
分布并
不均匀
,
我
想在这两个特性/坐标上绑定(比如pandas.qcut())时使用分位数。 有比在这两个特性上执行qcut()然后连接
结果
标签更好
的
方法吗?
浏览 0
提问于2017-04-15
得票数 5
回答已采纳
1
回答
Oracle中表
的
分区
、
我
有一个包含数百万行
的
表,在查询
数据
时需要很长时间才能从表中检索
数据
。
我
试着
根据
日期来
划分
它。
我
尝试使用Oracle中可用
的
重新定义包来
对
其
进行
分区,但没有工作。请给我一个有效
的
划分
表
的
方法。
浏览 1
提问于2012-01-18
得票数 0
2
回答
培训、测试和验证
数据
集
、
、
我
正在训练一个用于肿瘤分割
的
Unet模型。
我
有400名病人
的
数据
集。使用
的
图像是CT扫描(3D图像),
我
将其
划分
为2D图像(总共30k 2D图像)。
我
实际上将
数据
集分成: 10%
的
测试
数据
、18%
的
验证
数据
、72%
的
实际培训
数据
。
我
将测试和培训
数据
除以病人(即用于测试
浏览 0
提问于2020-11-06
得票数 3
回答已采纳
2
回答
是否有任何
策略
来
划分
应用SRP
的
责任?
、
、
、
是否有将类
划分
为应用单一责任原则
的
策略
? 在一个中等规模
的
团队中,我们正在开发一个可穿戴管理应用程序,它可以连接不同类型
的
可穿戴设备,比方说,Wearable1和Wearable2 (一次性连接)。每个可穿戴设备具有不同类型
的
交换
数据
的
能力。因此,
我
决定
根据
可穿戴类型来
划分
责任。,但我们
的
责任
划分
思想却是基于不同
的
方面。当我需要决定应该
根
浏览 3
提问于2019-12-04
得票数 1
回答已采纳
1
回答
火花流
数据
流执行,有状态,分区本地groupBy,避免洗牌
、
、
我
有一个基于Spark2.4.2& Kafka
的
流应用程序,它将聚合(时间窗口‘’ed)流写回Kafka:问题是,在没有洗牌
的
情况下,实现这一目标的正确方法是什么?有吗?到目前为止,
我
已经探索了一些解决方案: "agg o
浏览 2
提问于2020-03-13
得票数 0
1
回答
Dask按索引重新分区不像预期
的
那样工作,
导致
2个分区而不是3个分区
、
、
、
我
想把
我
的
达斯克
数据
按城市重新
划分
。
我
目前有超过100万行,但只有3个城市。因此,自然地,
我
希望有3个分区
数据
的
基础上,
我
包括
的
参数。
我
直接从Dask文档网站使用
的
代码:ddf_2 = ddf_1.repartition(divisions=list(ddf_1.index.uniq
浏览 13
提问于2022-03-03
得票数 0
回答已采纳
3
回答
如何
根据
数据
框列中
的
值
划分
数据
框?
所以,
我
有一个这样
的
数据
框架,2 3 101 100 NA NA3 2 110 100 101 NA1 2而文件,10将包含,3 4 就像这样,
我
想把它分开。
我
知道如何<e
浏览 0
提问于2014-09-24
得票数 0
6
回答
将火花
数据
作为动态分区表保存在蜂巢中
、
、
、
我
有一个示例应用程序可以从csv文件中读取
数据
。可以使用df.saveAsTable(tablename,mode)方法以拼花格式将
数据
存储到Hive表中。上面的代码工作正常,但是
我
每天都有这么多
的
数据
,所以我想
根据
creationdate(表中
的
列)动态地
划分
hive表。 是否有任何方法来动态
划分
数据
并将其存储到蜂窝仓库。希望避免使用hivesqlcontext.sql(insert into t
浏览 7
提问于2015-07-10
得票数 41
回答已采纳
1
回答
从scikit学到
的
缺失
数据
、
、
、
、
我
正在使用scikit-learn
的
hmmlearn模块运行一个简单
的
HMM。它适用于完全观测
的
数据
,但当我用丢失
的
数据
传递它
的
观测时,它就失败了。obs, type(obs)print posteriors 如果obs完全被观察到(每个元素都是0或1),那么它可以工作,但是
我
想得到未观测
数据
点
的
估计值
我
试着将它
浏览 2
提问于2016-01-24
得票数 0
回答已采纳
1
回答
复杂搜索索引
的
最佳Azure解
、
、
、
、
我
需要对组合
的
标记执行快速搜索,同时包括日期范围:用户
对
至少3天前发出
的
通知没有作出答复事件
数据
结构非常简单:EntityIdEventType日期 有关 对于数以十亿计
的
事件,
进行
表格扫描将无法工作。充其量,
我
可以缩小表,然后扫描一个更小
的
分区,但我不认为它会有多大
浏览 0
提问于2016-05-06
得票数 0
2
回答
更远距离查询会场提示
我
想在更远
的
距离上查询特定关键字
的
地点提示。目前,当我
进行
查询时,距离通常在40-80公里之间,然而,如果
我
想计算整个国家,
我
必须
进行
多次查询。
我
在
我
的
家乡特别创建了一个,并调整了经纬度和经度坐标,(+/- 40-80公里)它看起来距离半径并
不均匀
,某种类型
的
集群基础
的
四方
数据
结构。如果
我
想
对
一个国家
浏览 1
提问于2011-11-28
得票数 0
回答已采纳
2
回答
如何实现
对
纬度和经度值
的
邻近搜索?
、
、
、
、
我
的
应用程序(基于Qt
的
移动应用程序)以以下格式从服务器获取
数据
:纬度、经度、描述。
我
需要将这些
数据
存储在
数据
结构中,以便稍后快速检索。现在
我
有了一张地图,当用户点击地图上
的
一个点时,
我
得到了那个点
的
纬度和经度。使用这两个值,
我
需要快速扫描
我
的
数据
结构并检索相关
的
描述。
我
的
浏览 2
提问于2011-03-24
得票数 1
2
回答
表示聚类
结果
存储以供以后使用。
、
、
我
正在探索r编程环境,以便
对
我
的
测试
数据
进行
聚类分析。为了
进行
测试,
我
使用了一个列
数据
集,下面的散点图和直方图对应于值索引。 从
数据
中,
我
觉得这些值可以
划分
为7个集群。当我使用kmeans函数时,不将集群参数设为7,则得到以下
结果
。492.480 2979.013 1903.396 18682.262 1430.533 754221.
浏览 1
提问于2015-03-13
得票数 2
1
回答
根据
字符串中
的
间隔自动生成组
我
有几个单位
的
协变量
数据
。此外,
我
还可以使用一条评分规则,
根据
分数
对
我
的
观察
结果
进行
排序。
我
决定
根据
X
的
分位数来
划分
我
的
训练样本score,这是通过使用GenericMl包中
的
quantile_group函数实现
的
。列由TRUEs和FALSEs组成,表示score
的<
浏览 3
提问于2022-11-08
得票数 0
回答已采纳
1
回答
地理分区
的
算法
问题陈述:
我
有一个位置
数据
库,如果一个特定
的
位置,X在指定
的
距离半径内,
我
想返回。简而言之,返回搜索中点X半径内
的
所有城市。有没有一种算法可以有效地
划分
地图并
浏览 2
提问于2015-06-08
得票数 2
1
回答
Rails中devision
的
突然理性
结果
、
、
、
在IRB中执行devision时:
结果
总是0。但是,在运行在WEBrick或Apache/ value中
的
活动Rails应用程序中,相同
的
划分
会
导致
Rational类型
的
1/600值。在RubyMine 6.3.3中
对
断点表
进行
除法时,
我
得到了相同
的
合理
结果
。 这两个参数都是整数。
浏览 5
提问于2014-10-02
得票数 1
回答已采纳
1
回答
Jboss
数据
网格中键值
对
的
分布
、
、
我
正在使用Hotrod客户端在Jboss
数据
网格中加载2000万个未过期
的
条目。
我
的
热棒客户端运行在5台不同
的
机器上来加载
数据
。已成功添加条目。我们已经给出了复制因子2。我们发现在每个节点中添加
的
条目数量
的
变化超过了10%。例如,一个节点具有780万个条目,而另一个节点具有1200万个条目。所以我在想为什么条目不是均匀分布
的
,理想情况下每个节点应该有大约1000万个条目。我们上述测试
的
目标是检查负载
浏览 8
提问于2017-03-10
得票数 0
回答已采纳
1
回答
如何随机拼接稀疏矩阵
进行
机器学习分类
、
、
、
、
我
正在做一个利用稀疏矩阵
的
机器学习任务(具体地说,如果你熟悉的话,20个新闻组)。preprocess(testset.data)print(np.mean(predicted == testset.target)) 因此,
我
在整个训练
数据
集上
进行
训练,然后使用
我
的
分类器
对
测试
数据
进行
分类,
结果
打印出88%
的
浏览 0
提问于2015-11-09
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券