腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3380)
视频
沙龙
1
回答
哪种
排序
算法
最适合
大
数据
集
和
长
键
?
sorting
、
time-complexity
考虑一个包含大量待
排序
元素的
数据
集
,其中每个
键
都是一个
长
整型值,那么
哪种
排序
算法
是最好的?
浏览 16
提问于2019-09-29
得票数 0
回答已采纳
1
回答
哪种
排序
算法
在非常
大
的
数据
集
上效果最好
algorithm
、
sorting
我在互联网上搜索,以找出
哪种
排序
算法
最适合
非常
大
的
数据
集
。我发现许多人认为合并
排序
是最好的,因为它是公平的,而且它确保了时间复杂度是O(n log n),快速
排序
是不安全的:快速
排序
的变体也可能是不安全的,因为真实的
数据
集
可以是任何东西。如果交换这两个元素的时间开销可以忽略不计,那么为什么我们不能选择堆
排序
作为这种情况下的最佳
排序
算法</
浏览 2
提问于2015-08-27
得票数 18
回答已采纳
1
回答
对于我的二进制分类问题,
哪种
算法
是最好的选择?
classification
、
machine-learning-model
、
data-science-model
对于我的二进制分类问题,
哪种
算法
是最好的选择?我有大约200 K样本在培训
集
和
18个属性,包括二进制,数字
和
分类。 我想得到
最适合
我的问题的三
大
算法
的列表。
浏览 0
提问于2018-09-23
得票数 -2
2
回答
分类和数值混合特征的机器学习
算法
machine-learning
我有一个包含1000个样本的训练
数据
集
。它包含大约50个特征,其中30个是分类特征,其余是数字/连续特征。
哪种
算法
最适合
处理分类特征
和
连续特征的混合特征集?
浏览 0
提问于2016-11-05
得票数 3
4
回答
生成几乎没有唯一值的
数据
集
c#
、
algorithm
我想要更多关于
排序
算法
,还有比编码更好的方法!所以我想我需要一些
数据
来处理。 我创建一些“标准”
数据
的方法如下:创建一组项目,不确定它有多大,但我想找点乐子,让我的计算机发出一点呻吟:D。一旦我有了这个列表,我将把它推到一个文本文件中,然后读取它来运行我的
算法
。我应该有4个文本文件填充相同的
数据
,但只是
排序
不同,以运行我的
算法
(见下文)。如果我错了,请纠正我,但我相信我需要4种不同的场景来分析我的
算法
。随机
排序
的<e
浏览 3
提问于2011-08-13
得票数 1
回答已采纳
3
回答
表示
和
乘以稀疏布尔矩阵的最快方法是什么?
algorithm
、
performance
、
data-structures
、
matrix
、
bit-manipulation
所以,我使用的布尔矩阵的维数通常是几十到几百,它们通常是相当稀疏的(在大多数行
和
列中只有2-4个非零),并且我的运行时主要由它们的乘法控制。 在这种情况下,
哪种
数据
结构
最适合
加速乘法?目前,我将每个矩阵按行存储在一个连续的位
集
(64位
长
的数组)中,并使用基本的标准
算法
将它们相乘,只是通过在字中定位下一组位的快速操作以及通过位掩码操作进行矢量化来加速稀疏性。
浏览 0
提问于2010-09-05
得票数 9
2
回答
欧洲网站的最佳字符
集
和
排序
规则
sql
、
mysql
我需要知道
哪种
排序
规则
和
字符
集
最适合
用户输入的
数据
。或者我应该为每种语言单独制作一个表。如果有一篇文章能解释这一点,那就太好了。 谢谢:)
浏览 0
提问于2010-06-28
得票数 4
回答已采纳
1
回答
二进制分类
算法
machine-learning
、
classification
我有一个零售客户交易
数据
集
,具有客户ID,产品,日期,购买产品数量,客户邮政编码,交易金额等功能。已有一种基于业务规则的细分,如果客户对可口可乐感兴趣或不感兴趣的话,可以根据其购买情况进行细分。对于
哪种
算法
和
方法
最适合
这个
数据
集
,有什么建议吗?
浏览 0
提问于2019-09-17
得票数 1
3
回答
数据
结构:有效地
排序
和
搜索
data-structures
、
search
、
sorting
我需要一个
数据
结构,比如说4
键
。我可以对这些钥匙中的任何一个进行
排序
。我可以选择什么
数据
结构?分拣时间应该很短。这4个字段源ip,目标ip,源端口,目标共有12个字节,每个记录的总大小为40字节。大约一个lac记录打印时,对
浏览 0
提问于2012-09-18
得票数 3
1
回答
对于Python中的dict
排序
,这两种
排序
格式是否完全相同?
python
print(s1)指纹如下:[3, 4, 1, 2, 0]我通常使用第二种方法来按值对
数据
进行
排序
,但是今天我看到了其他人的代码来使用第一种方法来对一个
数据
进行
排序
。
浏览 2
提问于2022-05-26
得票数 1
回答已采纳
3
回答
LINQ Joins -性能
sql
、
linq
、
join
每个节点都提供了有关是否执行
排序
、扫描、选择、连接等操作的信息。在我们的执行计划中的“Join”节点上,我们可以看到三种可能的
算法
: Hash Join、Merge Join
和
Nested Join。Sql Server将根据内表
和
外表中的预期行数、我们正在执行的连接类型(某些
算法
不支持所有类型的连接)、我们是否需要
数据
排序
以及许多其他因素来选择每个连接操作的
算法
。加入
算法
: 嵌套循环连接:
最适合
小输入,可以通过有序
浏览 1
提问于2010-06-14
得票数 11
回答已采纳
1
回答
在approxSimilarityJoin()函数上永远保持稳定
java
、
apache-spark
、
locality-sensitive-hash
、
minhash
我试图在包含50000行
和
5000个特性的大型
数据
集中为每个用户找到最近的邻居。这是与此相关的代码。
浏览 6
提问于2018-02-22
得票数 3
16
回答
哪种
排序
算法
提供了最佳的最坏情况性能?
algorithm
、
sorting
对于绝对最坏的情况,已知的最快
排序
算法
是什么?我不关心最好的情况,假设有一个巨大的
数据
集
,如果这很重要的话。
浏览 0
提问于2009-04-21
得票数 4
3
回答
DBM
数据
库的理想字符串长度?
database
、
berkeley-db
、
dbm
、
gdbm
当使用DBM
数据
库(例如Berkeley或GDBM)时,使用较少的
长
字符串存储
数据
还是使用较多的短字符串存储
数据
更好?无论
哪种
方式,我都可以很容易地组织我的
数据
。
浏览 4
提问于2009-07-15
得票数 1
1
回答
占用大量内存的Redis
数据
结构
memcached
、
redis
、
in-memory-database
、
in-memory
我在Redis上做了一个实验来测试
大
键
的内存使用情况。我加载了1 600万字符串,其中包含50-60个字符(字节),大致将磁盘上的802 MB放入Redis中的
排序
集
。它耗尽了(膨胀到)3.12GB的RAM用于这个
排序
集
。 然后,我将1600万个短字符串 (10-12个字符)加载到另一个
排序
集中,占用磁盘上220 MB的空间,它仍然消耗了2.5GB的内存。很明显,磁盘上的空间使用减少了很多(减少了72%),但是Redis
排序
集
仍然使用
浏览 11
提问于2013-02-17
得票数 3
回答已采纳
2
回答
卡桑德拉(Hbase)的memtable (memstore)中的
数据
排序
cassandra
、
hbase
我知道输入到系统的
数据
首先放在内存中(memtable或memstore)。在缓冲区中,根据行
键
和
列名对
数据
进行
排序
。当缓冲区大小达到一定的限制时,
数据
将被刷新到磁盘。如果将缓冲区大小限制配置为
大
值(~256 MB),则
数据
点的数目必须非常
大
(~数千万)。为此目的所使用的
数据
结构
和
排序
算法
是什么?
浏览 5
提问于2015-11-09
得票数 1
回答已采纳
2
回答
在Android中存储字符串
和
图像
数据
的最佳方式?
java
、
android
、
xml
我想要完成的是,我有大量的静态
数据
,组织如下:大小: 2m地域: QLD颜色:棕色我需要存储大约200组这样的
数据
,以及每个
数据
集
的图像。)
和
大小 因此,我需要能够按属性对
数据
进行
排序
。(我认为这种方法
最适合
动态
数据
,而不是静态
数据
)。谁能告诉我我应该用
哪种
方式存储我的
数据
浏览 3
提问于2013-05-28
得票数 0
1
回答
如何在Django/Postgres应用程序中存储用户位置
python
、
sql
、
django
、
postgis
、
geodjango
,我的目标是为用户存储尽可能多的位置
数据
,这样我就可以做一些机器学习来计算他们日常活动区域中的哪些职位将
最适合
他们。我使用GeoDjango
和
PostGis来使应用程序位置感知,并且很难确定
数据
库中
哪种
数据
结构
最适合
这种情况。问题在于我是否应该给每个用户一个location = pg_fields.ArrayField()属性,这个属性最终会变得非常
大
,还是使用location=models.ManyToManyField(我知道,在具有大数组的Pos
浏览 0
提问于2018-03-13
得票数 1
回答已采纳
3
回答
在GLSL中快速
排序
?
opengl
、
glsl
、
gpgpu
、
quicksort
我遇到的一个直接问题是,在其中一个步骤中,
算法
需要维护一个元素列表,对它们进行
排序
,并取几个最大的元素(哪个数字取决于
数据
)。在CPU上,这只需使用STL向量
和
qsort()即可完成,但在GLSL中,我没有这样的工具。有没有办法解决这个问题呢?
浏览 0
提问于2009-04-05
得票数 6
回答已采纳
1
回答
当所有列都有大致相同的方差时,维数的降维和预测
python
、
dataset
、
predictive-modeling
、
random-forest
、
pca
我有一个25列的
数据
集
,目标是根据前24列预测第25列的值。
数据
集
相当
大
,这就是为什么我最初认为在进行任何预测之前都要继续进行PCA。我想知道在这种情况下可以做些什么来降低维数,以及什么
数据
科学
算法
最适合
解决这个问题。我已经尝试过OLS,随机森林,SVR
和
梯度增强回归,但他们的分数在目前看来相当令人失望,撇开计算时间是相当
大
的事实。
浏览 0
提问于2020-04-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
图书推荐:算法
数据库内核杂谈(五):如何实现排序和聚合
彻底搞懂稳定排序与不稳定排序
实例详解机器学习如何解决问题
机器学习中的模型评价、模型选择与算法选择
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券