腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
给定
索引
的
值
相似
度
对
numpy
数组
进行
分组
python
、
numpy
、
grouping
我有几个
numpy
数组
: orig = [[28021.22333333, 6585.53333333, 0. ], [27677.54132953, 6726.98339422, 2800. ]] 现在如何根据idxs
的
值
对
tri、pnts和idxs中
的
值
进行
浏览 6
提问于2020-06-24
得票数 0
回答已采纳
2
回答
基于
相似
度
的
文本流聚类算法最近有什么突破吗?
text
、
cluster-analysis
、
similarity
我需要有一个轻量级
的
文本流聚类工具。轻量级
的
意思是它没有内存,所以它可以记住之前
的
文本条目。文本流在这里指的是字母数字和半结构化句子/短语
的
连续输入,例如:任何应用程序
的
日志。
基于
相似
度
的
聚类是指算法
对
具有模式
相似
度
的
文本
进行
分组
聚类。例如: text1 = 'aaababac‘和text2 = '
浏览 3
提问于2012-06-22
得票数 3
1
回答
在python中过滤大型稀疏矩阵
python
、
scipy
、
sparse-matrix
我有一个以scipy sparse csr_matrix格式存储
的
大型(60,000 x 60,000)对称文档
相似
度
矩阵。我
的
ipython内核崩溃了。 我刚接触scipy和
numpy
,所以任何帮助都将不胜感激。
浏览 2
提问于2015-02-12
得票数 1
4
回答
查找多个
数组
具有相同
值
的
索引
的
快速算法
python
、
performance
、
numpy
我正在寻找加速(或替换)数据
分组
算法
的
方法。 我有一个
numpy
数组
的
列表。我想要生成一个新
的
numpy
数组
,这样这个
数组
的
每个元素对于每个
索引
都是相同
的
,而原始
数组
也是相同
的
。(
索引
0和4)具有相同
的
值
(0),因为原始
的
两个
数组
也是相同
的
浏览 6
提问于2016-06-23
得票数 7
回答已采纳
1
回答
在IGraph中生成按端点
的
Jaccard
索引
排序
的
边
的
列表
c
、
algorithm
、
graph
、
igraph
、
similarity
我需要一些帮助来弄清楚如何在igraph
的
C接口中根据端点
的
Jaccard
索引
对边
进行
排序。 我已经能够计算所有
对
的
Jaccard
索引
,但我只需要相邻顶点
的
Jaccard
索引
列表。在我
的
例子中,我使用
的
是Zachary空手道俱乐部网络,它有34顶点和78边。
索引
降序排序
的
边。我认为,为了只得到相邻
的
顶点,我需要在边上迭代并手动计算,但我发现使用图
浏览 1
提问于2015-07-21
得票数 0
1
回答
如何在Solr中管理排名系统
solr
我有一个Solr设置来实现一个搜
索引
擎。同时,我想在结果之上展示常规购买
的
低等级产品。 有可能做到这一点吗?
浏览 0
提问于2019-04-17
得票数 0
1
回答
对
字形
进行
分组
algorithm
、
sorting
、
anagram
给定
单词
数组
,
对
字谜IP:{tar,rat,banana,atr} OP:{tar,rat,atr,banana}
进行
分组
这个问题
的
一个解决方案是使用哈希表。考虑每个单词,
对
其排序,如果不存在则将其作为关键字添加到哈希表中。键
的
值
将是具有相同键
的
所有字形
的
列表。我想知道时间复杂
度
,为了对
数组
中
的
字符
进行
排序,假设O(n log
浏览 0
提问于2013-07-30
得票数 2
1
回答
一种在文本文件中查找模式
的
快速算法
python
、
cross-correlation
我有一个双精度
数组
,大约200,000行x 100列,我正在寻找一种快速算法来查找包含与
给定
模式(模式可以是10到100个元素)最
相似
的序列
的
行。我使用
的
是python,所以暴力方法(下面的代码:循环遍历每行和开始列
索引
,并计算每个点
的
欧几里德距离)大约需要三分钟。
numpy
.correlate函数有望更快地解决这个问题(在不到20秒
的
时间内运行相同
的
数据集)。然而,它只是计算整行模式
的
滑动点积,这
浏览 0
提问于2012-02-07
得票数 10
回答已采纳
1
回答
将数据与游戏评分
的
理想
值
进行
比较
python
、
numpy
、
cosine-similarity
我使用
基于
理想
值
数组
和数据收集
数组
的
余弦
相似
度
来计算分数。(下面的代码)然而,当我运行下面的代码时,结果是99.4,我认为这很奇怪,因为as150与理想
值
300相差很远。import
numpy
as np print(&q
浏览 0
提问于2018-12-19
得票数 0
1
回答
如何计算facebook中两个用户
的
相似
度
?
algorithm
、
similarity
我正在做一个关于数据挖掘
的
项目。我
的
公司给了我600万个Facebook
的
虚拟客户信息。我被指派去找出任何两个用户之间
的
相似
性。谁能给我一些想法,如何处理大量
的
社区数据?提前感谢:) 问题:我使用状态信息和hashtag信息(hashtag是用户突出显示
的
单词)作为衡量两个不同用户之间
相似
度
的
两个标准。因为有大量
的
用户,特别是可能有数百万个标签和每个用户
的
状态。谁能告诉我一个快速计
浏览 0
提问于2012-11-30
得票数 4
3
回答
如何使用word2vec查找与向量最接近
的
单词
python
、
text-mining
、
data-analysis
、
word2vec
我刚开始使用Word2vec,我想知道如何才能找到与向量假设最接近
的
单词。我有这个向量,它是一组向量
的
平均向量:有没有一种直接
的
方法可以在我
的
训练数据中找到与这个向量最
相似
的单词或者唯一
的
解决方案是计算这个向量和我训练数据中每个单词
的
向量之间
的
余弦
相似
度
,然后选择最接近
的</e
浏览 0
提问于2015-09-24
得票数 27
回答已采纳
1
回答
Mahout推荐-添加
基于
内容
的
相似
性与
基于
项目的推荐
mahout
、
recommendation-engine
、
mahout-recommender
我有一个相当标准
的
基于
Mahout项目的新闻文章推荐(使用点击数据,所以首选项是布尔型
的
): 文章内容
相似
度数据
的
浏览 3
提问于2013-01-08
得票数 4
回答已采纳
1
回答
什么是文档向量中
的
“信息”使情感预测工作?
machine-learning
、
sentiment-analysis
、
gensim
、
feature-selection
、
doc2vec
基于
文档向量
的
情感预测效果很好,例如: 随机初始化一个固定
的
“比较”向量,得到训练和测试集中“比较”向量与所有其他向量
的
余弦
相似
度
,利用训练集
的
相似
性和标记来估计一个logistic回归模型,用测试集
对
模型
进行
浏览 5
提问于2017-06-01
得票数 1
回答已采纳
1
回答
如何在一个操作中为数据结构
的
所有元素设置一个
值
(同时)
java
、
arrays
、
algorithm
、
hashtable
编写包含以下方法
的
UnlimitedArrayInt类。每个方法都应该具有O1复杂
度
:* void setAll(int number) -所有整数都设置为
给定
的
数字;* int get(int index) -返回
给定
索引
处
的
数字。
索引
可以是任何正整数值;* void set(int index, int number) -在
给定
索引
处设置数字。
数组
没有限制,所以它可以是任何正整数值;数字可以是任
浏览 0
提问于2019-12-14
得票数 2
1
回答
比较多个数值列以确定记录
相似
性
sql
、
oracle11g
1 ║ -2 ║ -1 ║╚════╩══════╩══════╩══════╩══════╝ 我想在所有列中按
相似
度
对
ID
进行
分组
。例如,上面的ID A和G是
相似
的,因为它们在每一列中
的
值
非常
相似
。ID
对
,我正在考虑计算每一列中
的
差异,然后将差异相加,以获得
相似
度
得分(较大
的
浏览 1
提问于2014-10-04
得票数 1
2
回答
在
数组
中找出“s”差
的
所有
对
arrays
、
algorithm
、
time-complexity
我有一个长度为n
的
数组
,其整数位于0,n^5范围内。我想在
数组
中找到所有的
对
,它们之间
的
差异是一个
给定
的
值
s
的
整数变量(例如,对于
数组
中
的
整数a,b,如果它们满足
给定
的
要求,我们将有all=s或b=s)。什么是最好的确定性算法(即不使用哈希集或
相似
)来查找所有
对
?我能用O(n)时间复杂
度
来做吗?我
的</
浏览 5
提问于2017-07-29
得票数 2
回答已采纳
3
回答
不同长度向量
的
余弦
相似
性?
python
、
nlp
、
similarity
、
nltk
、
tf-idf
我已经计算了一些文档
的
tf_idf,但现在当我尝试计算其中两个文档之间
的
余弦
相似
度
时,我得到
的
回溯结果是:cosine_distance(u[:200], v[:200])
对
向量
进行
切片以使我认为余弦
相似
<em
浏览 1
提问于2010-06-26
得票数 15
回答已采纳
1
回答
用权重规范排名分数
python
、
nlp
、
nltk
、
normalize
、
cosine-similarity
我正在处理一个文档搜索问题,在这个问题中,
给定
一组文档和一个搜索查询,我希望找到最接近查询
的
文档。我所使用
的
模型是
基于
TfidfVectorizer
的
scikit。接下来,对于
给定
的
搜索查询,我使用这4个模型计算搜索项与所有其他文档之间
的
余弦
相似
度
。 例如,搜索查询:量子物理学中
的
奇点。将搜索查询分解为n-g,并从相应
的
n-g模型中计算tf_idf
值
。因此,对于每
浏览 2
提问于2015-08-11
得票数 1
回答已采纳
3
回答
根据一个
numpy
数组
中
的
值
对
另一个数值
数组
中
的
值
进行
分组
python
、
python-3.x
、
numpy
我已经看了一遍,看看我是否能找到我
的
问题
的
答案,但我认为我
对
numpy
的
了解太低了,不知道我是否找到了它!
给定
两个形状相同
的
数组
,我想根据组A中
的
共享
值
对
数组
B中
的
值
进行
分组
。例如 arraya = [1,1,1,1,2,2,2,2,3,3,3,3] arrayb = [45,56,75,34,657,67,88,32,56,
浏览 64
提问于2021-07-30
得票数 0
回答已采纳
1
回答
如何
对
numpy
数组
中
的
相似
值
进行
分组
/循环/量化
python
、
numpy
是否有一个
numpy
方法,让我们恢复
numpy
数组
的
量化结构,如果我事先不知道量化
的
值
/级别是什么,但是知道,例如,它们
的
间距> 1.0?例如:x = np.array([0.5, 0.5, 1.75, 1.75, 1.75,6.45,6.45,0.5, 11.1, 0.5, 6.45])是否有一种只给出
浏览 1
提问于2022-06-24
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
NumPy能力大评估:这里有70道测试题
科学计算工具-Numpy初探
数据处理遇到麻烦不要慌,5个优雅的Numpy函数助你走出困境
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券