腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1151)
视频
沙龙
1
回答
在按
字符串
相似
度
对
条目
进行
排
序时
,
使用
数据库
会
提高
性能
吗
?
javascript
、
database
、
information-retrieval
、
querying
Maracaibo", "population": 19637,}] 我执行一个查询,按名称
对
城市
进行
排序为此,
使用
数据库
有什么好处
吗
?我已经得到了非常令人满意的结果,但我不知道我是否可以把速度
提高
一点,以便为新功能获得更多开销。 用途是:用户将进入
浏览 33
提问于2021-01-18
得票数 0
回答已采纳
1
回答
在大型数据集中查找可能匹配的
字符串
hashmap
、
string-comparison
、
wikipedia
、
n-gram
、
large-data
我正在
进行
一个项目,在这个项目中,我必须处理文本文档,并通过维基百科链接来增强它们。预处理文档包括定位所有可能的目标文章,因此我提取所有的ngram并与包含所有项目名称的
数据库
进行
比较。当前的算法是一个简单的无实例
字符串
比较,前面有简单的裁剪。但是,我希望它更灵活,更能容忍错误,或者像前缀这样的小文本修改。此外,
数据库
很大,我觉得在这么大的
数据库
中
进行
字符串
比较不是最好的主意。我想到的是一个散列函数,它将为任何文章或ngram分配一个唯一的(我宁愿避免
浏览 0
提问于2014-03-09
得票数 1
回答已采纳
1
回答
标记和/或搜索
mysql
、
database-design
、
search
、
tags
、
full-text-search
如果我
使用
标签的话。我的想法是,我将词条剥离为单词,并将随之而来的任何元数据都剥离为标签。模式将是mysql人员推荐的Toxi (多
对
多)模式。我
对
标签的问题是它们不像搜索那样灵活。除非,您还实现了
对
标记的搜索。在这一点上,我担心
性能
,或者为什么不直接
使用
直接搜索。第二个问题是将标签的重复和
相似
度
降到最低。如果您愿意,可以标记垃圾收集。如果我
使用
搜索,我将不得不
使用
LIKE或FULLTEXT (虽然myISM不是很好
浏览 2
提问于2011-05-11
得票数 5
1
回答
MongoDB是否适合加载随机记录?
mongodb
我们的应用程序
使用
较短的文本( 100-1000个字符的
字符串
)存储记录。它提供
对
给定查询文本的最
相似
记录的搜索。我们
使用
Lucene对文本
进行
索引。完整的记录存储在
数据库
中。我们采用Mysql作为
数据库
,每个域都有自己的表。现在,由于向外扩展,我们尝试迁移到MongoDB。所有记录都存储在单个集合中,domain是记录的一个属性。Ids仍然是从Lucene搜索中获得的。但我们观察到,与
使用
Mysql的解决方案相比,从MongDB加载
浏览 3
提问于2012-06-26
得票数 0
回答已采纳
2
回答
如何在
数据库
中查找重复项?
php
、
mysql
、
duplicates
、
duplicate-removal
关于如何在
数据库
中查找重复项有很多问题,但不是我所遇到的具体问题。 我有一张桌子,大约有。120000个
条目
。我需要找到复制品。不可能对初始查询中已经存在的所有重复项
进行
排序,因为我必须遍历所有
条目
,因为我的重复搜索不仅对100%
相似
的
条目
敏感,而且
对
90%
相似
的
条目
也很敏感。为此,我
使用
similar_text()。我认为第一个循环是可以的,但是循环遍历循环中的所有其他
条目
太多了。对于120000
浏览 1
提问于2012-07-13
得票数 0
回答已采纳
3
回答
使用
MongoDB实现更高效的近似
字符串
匹配
java
、
regex
、
mongodb
、
string-matching
、
similarity
我有一个相对较大(几乎130000个文档)的MongoDB名称集合,由于光学字符识别噪声,其中包含许多重复项,我正在尝试
使用
近似
字符串
匹配将这些重复项分组在一起。我已经
使用
在Java语言中实现了这一点,如下所示: } } finally{ persons.cl
浏览 2
提问于2015-03-19
得票数 2
2
回答
为什么Get和MultiGet对于大密钥集要比
使用
Iterator慢得多?
c++
、
rocksdb
目前,我正在
使用
RocksDB (C++),并且
对
我所经历的一些
性能
指标感到好奇。 出于测试目的,我的
数据库
键是文件路径,值是文件名。我的
数据库
里有大约200万条
条目
。当我想查看
数据库
中的所有键时,我看到在
使用
Iterator而不是为每个键调用Get时,
性能
提高
了4-8倍。MultiGet的
使用
没有什么不同。为什么反复调用Get比
使用
Iterator慢得多?有办法缩小这两个API之
浏览 0
提问于2019-03-26
得票数 2
回答已采纳
1
回答
如何处理Django的Queryset的低效?
python
、
django
、
database
考虑到这个过程只是试图获得它的长度(通过
使用
len函数,我也尝试了count()方法,但它似乎在一定程度上是有限的),我知道通过对象的搜索是可以忽略不计的(特别是利用
相似
算法
对
它们
进行
搜索)。elif sim > zenith_sim[1]:return str(zenith_sim[0]) 上面的代码搜索与用户
字符串
最
相似
的
字符串
,尽管为了避免不重要的迭代,如果
相似
浏览 2
提问于2018-02-10
得票数 1
4
回答
但这是个好主意
吗
?
mysql
、
database-optimization
长话短说,我正在开发的应用程序的一部分需要在
数据库
中存储一定数量的数据,以便应用程序的另一部分稍后得到。通常情况下,这将是< 2000行,但偶尔
会
超过300,000行。现在,有很多东西要塞进一
排
桌子里。请注意,数据最多不会超过60-80 MB的。但我的问题是,实际这么做是个好主意
吗
?我目前正在
使用
的两个解决方案如下所示: finish.Inserting 将所有数据作为单个行插入到“临时”表中,该表将在完成后作为序列化
字符串
截断所有数据到行中的LONGTEXT列中。纯粹从
性
浏览 8
提问于2010-01-19
得票数 0
回答已采纳
1
回答
实体框架高效查询
sql-server
、
entity-framework
、
linq-to-sql
如果我执行类似于var articles = db.Articles.ToList()的操作,那么它就是为
数据库
中的每一篇文章检索整个文章模型,并将其保存在内存中,
对
吗
?因此,如果我正在填充一个只显示
条目
日期和标题的表,是否有一种方法可以只
使用
使用
实体框架从
数据库
中检索这些列,它会更有效
吗
? 在对象上下文中跟踪返回的对象需要付出一定的代价。检测对象的更改并确保
对
同一个逻辑实体的多个请求返回相同的对象实例需要将对象附加到Obj
浏览 0
提问于2012-07-21
得票数 4
回答已采纳
5
回答
什么是
数据库
索引?
database
、
indexing
我知道它们可能
会
提高
性能
,而且它们似乎是特定于列的-- (“我们在date_of_birth列上为用户表建立索引”)。 我只是想快速了解它们到底是什么,它们是用来做什么的,以及它们是如何工作的。
浏览 6
提问于2013-03-06
得票数 54
1
回答
针对超大查询的最快MySQL引擎
mysql
、
sql
、
performance
在测试期间,该站点在传统的MySQL DB中搜索了40,000个
条目
,以获得各种不同的标准,然后根据总体排名
对
每个
条目
进行
排序和显示。对于这种级别的数据,
性能
非常好,平均在2-3秒内返回结果。因为信心十足,我将
数据库
中的
条目
从40,000个增加到大约325,000个。现在,在
数据库
中搜索大约需要4分钟。一次搜索
使用
大约2 2GB的RAM!如果我再多工作一个月,我的
性能
可能
会
提高
1%
浏览 0
提问于2014-02-02
得票数 0
5
回答
在SQL Server中,什么时候应该
使用
索引视图而不是真正的表?
sql-server
、
indexed-view
但是,为什么我需要
使用
视图而不是表呢?
浏览 1
提问于2010-10-05
得票数 4
回答已采纳
2
回答
将SQLExecDirect与预先格式化的查询
字符串
而不是SQLPrepare+SQLBindParameter+SQLExecute一起
使用
是否是个坏主意?
sql
、
sql-server
、
visual-c++
、
odbc
以下是我的想法:司机迟早会有(我怀疑晚些时候,但无论如何.)将参数(我用SQLBindParameter提供给它)转换为
字符串
表示形式,
对
吗
?(也许不是?)因此,如果我在我的应用程序中
进行
这种格式化(printf-like格式),我的
性能
会有任何损失
吗
?如果不是这样,那么在应用程序中
使用
SQLPrepare+SQLBindParameter+SQLExecute而不是格式化完整的查询
字符串
,然后
使用
SQLExecDirect是否<em
浏览 1
提问于2012-02-08
得票数 1
回答已采纳
3
回答
在mongodb中,索引正在
进行
的活动,或者我们需要cron
吗
?
mongodb
我对
数据库
的整个索引是新手,想知道我是否发出了下面的命令即使发布了新
条目
,
数据库
也
会
始终被索引
吗
?另外,索引对于2000+
条目
的
数据库
有很大的影响
吗
?
浏览 0
提问于2012-06-28
得票数 3
回答已采纳
2
回答
使用
Pandas Dataframe时,Scipy Cosine
相似
性非常慢
python
、
pandas
、
dataframe
、
cosine-similarity
、
collaborative-filtering
我正在
使用
协同过滤来获取两个数据帧之间的余弦
相似
度
,如下所示for i in range(0,len(user_normalized.index你们能帮我一下
吗
?
浏览 2
提问于2018-05-23
得票数 0
1
回答
这个长的python类型声明是否正确,是否有更短、有效的声明?
python
、
python-3.x
、
python-typing
首先,它是正确的
吗
?它的确切含义是什么?在这种情况下,有没有更简单的方法来
进行
类型声明?例如,List[Dict]是否同样有效?
浏览 0
提问于2020-05-12
得票数 0
1
回答
在中型
字符串
数据集中
使用
AutoCompleteTextView的最佳方法
android
、
database
、
sqlite
如果我想
使用
AutoCompleteTextView作为搜索函数,根据用户当前输入的文本生成一个
字符串
列表(假设大约1000-3000个
字符串
),那么最好是从外部
数据库
加载这些
字符串
,还是将它们存储在内部SQLite
数据库
中并从那里加载
字符串
?我计划存储的
字符串
数量是否太大(每个
字符串
大约有10-20个字符长,它们是常量,不会更改)在SQLite
数据库
中
使用
吗
?这会在多大程度上减缓
浏览 3
提问于2016-04-26
得票数 2
回答已采纳
1
回答
在MySQL中存储100 K×100 k数组
mysql
、
database
以下是我的想法: 100 k*100 k可以生成100亿个数据点,这比32位可以得到的多,所以我不能
使用
INT作为主键。在研究堆栈溢出时,一些人在
使用
BI
浏览 1
提问于2017-06-10
得票数 1
2
回答
Android:
使用
UUID作为SQLite的主键
android
、
performance
、
sqlite
、
primary-key
、
uuid
我的问题是:在android sqlite
数据库
表中,
使用
UUID (String / integer )作为主键,而不是一个
会
自动递增的整数,是不是一个坏主意?我猜
使用
字符串
( UUID有36个字符)作为主键会有
性能
问题。然而,我看不到任何其他的可能性来实现这样的协作同步系统,所
浏览 0
提问于2013-01-07
得票数 34
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
MySQL高性能表设计规范
MySql实战篇:建立高性能的Mysql技巧
Elasticsearch 索引的映射配置详解
有史以来最快的Unity编辑器版本,Unity 2020.2 中的性能优化
谷歌AI一次注释了10%的已知蛋白质序列,超过人类十年研究成果
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券