腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(853)
视频
沙龙
2
回答
如何将
索引
向量
更
改为
稀疏
特征向量
,以
便在
sklearn
中
使用
?
、
、
、
、
[123,41]011425002581540 [341,214,286] 第一列为userID,第二列为newsID,newsID为
索引
列,例如转换后,第一行的[12,456,157]表示该用户已经阅读了第12、456、157条新闻(
稀疏
向量
中
第12、456、157列为1,其他列取值为0)。我想将这些数据转换为
稀疏
向量
格式,可以用作
sklearn
的Kmeans或DBscan算法的输入
向量</em
浏览 14
提问于2017-08-15
得票数 2
回答已采纳
1
回答
稀疏
特征向量
序列作为LSTM的输入
、
、
、
我需要在我的输入数据上建立一个LSTM模型,这是
稀疏
向量
序列。每个示例的格式是: v_1、v_2、.、v_t,其中每个v_t都是时间t时
稀疏
的
特征向量
,格式为i_1、i_2、.、i_n,其中i_j是以1为值的特征
索引
(其他内容为0)。通常,非零特征的数量约占全部特征的0.001,因此数据非常稀少。现在我要做的是,对于每个批处理,我将
稀疏
数据转换为密集的numpy矩阵,然后直接传递给LSTM (我不能将整个数据转换为密集格式,因为它不适合内存)。我相信我可以从
使用
嵌入<e
浏览 4
提问于2021-12-17
得票数 2
2
回答
如何比较
使用
scikit learn库load_svmlight_file存储的2个
稀疏
矩阵?
、
、
、
我正在尝试比较存在于测试和训练数据
中
的
特征向量
,
使用
scikitlearn库将
特征向量
以
稀疏
格式存储,两个数据集的
特征向量
的维数都是same.However,我得到了这个错误:“具有多个元素的数组的真值是不明确的请
使用
a.any()或a.all()。”提前感谢!from
sklearn
.datasets import load_svmlight_file pathToTrainData=&q
浏览 2
提问于2014-04-17
得票数 2
2
回答
梯度增强与
Sklearn
、
、
、
、
我想
使用
Sklearn
的GradientBoostingRegressor类来预测回归问题中目标变量的值。我所拥有的特征是混合型的--有些是连续的数值,有些是布尔型的,两个是范畴型的,一个是连续数的
向量
。我选择梯度提升树,特别是因为数据是混合数据类型。
特征向量
的一个例子是: 类别1,41.93655,-87.642079,0,0,<1x822类型
稀疏
矩阵,包含4个存储在压缩
稀疏
行format>
中
的元素,'mobile_app','
浏览 6
提问于2013-11-23
得票数 0
回答已采纳
1
回答
Sklearn
线性回归实例
、
、
如果不充分了解这一点,我就无法很好地
使用
该工具进行预测。谢谢。
浏览 0
提问于2016-07-22
得票数 4
回答已采纳
1
回答
将
稀疏
向量
的字符串表示转换为Pandas数据
、
、
我有一个
向量
vec,其中每个元素都是
稀疏
向量
的字符串表示。我想要的输出是具有以下特性的Pandas DataFrame: 列:
稀疏
向量
索引
稀疏
向量
用<feature_index>:<feature_value>格式编码我
使用
的实际数据集相当大,因此如果可能的话,我想利用本地Pandas
中<
浏览 2
提问于2017-04-28
得票数 1
回答已采纳
1
回答
在MATLAB
中
利用指数矩阵构造SIFT
特征向量
、
我正在尝试优雅地构造一个SIFT特征描述符,如MATLAB
中
的Lowe's 中所述。我见过的大多数方法都相当混乱,我想找到一种优雅的方法来完成这项工作。我
使用
以下代码来获取每个方向/大小的bin编号:binned现在是与每个单元格的
特征向量
相对应的
索引
矩阵(它由数字为了构建128个元素的特征描述符,我需要确定16个单元的
特征向量
(直方图)。我一直在尝试将binned矩阵拆分为16个单元格,同时保留
浏览 14
提问于2016-09-19
得票数 0
5
回答
Scikit-Learn的管道:一个
稀疏
的矩阵被传递,但是需要密集的数据
、
、
、
我发现很难理解如何修复我创建的管道(阅读:主要是从教程
中
粘贴)。
浏览 13
提问于2015-02-07
得票数 49
回答已采纳
1
回答
使用
scipy的各种
稀疏
矩阵乘积的性能
、
、
、
我有一个术语文档矩阵作为
稀疏
矩阵( csr或coo矩阵),还有一个要进行相似性比较的
特征向量
。2.)将doc矩阵作为csr矩阵,将其转换为ndarray,然后矩阵将该矩阵与
向量
相乘,并除以幅度和反余弦,
以
获得相似分数第三种方法<e
浏览 2
提问于2018-12-10
得票数 1
1
回答
图库生成
稀疏
矩阵的误差:下标
索引
必须是实正整数或逻辑
、
、
、
我通过以下方法生成了一个
稀疏
矩阵:当我试图通过以下方法生成这个函数的
特征向量
时:我收到的标准错误"Subscript
索引
必须是真正的正整数或逻辑。这仅仅是由于我创建
稀疏
矩阵的方式,即用图库命令吗?如果是这样的话,我如何在没有这个问题的情况下创建矩阵呢?我发现了以下情况: 他们
使用
不同的算法,针对不同的问题和不同的目标。eig是一种良好的、快速的、通用的特征值/<
浏览 3
提问于2015-10-28
得票数 0
回答已采纳
1
回答
在斯坦福NER
中
,单词是如何转换为
向量
的
、
当
使用
线性CRF训练模型时,它们是否
使用
Word2Vec或Glove转换为
向量
。 更多的研究表明,数据存储在CRFDatum结构
中
。有没有人能详细说明一下?
浏览 11
提问于2017-07-21
得票数 0
回答已采纳
2
回答
Python /scipy
特征向量
似乎不适合马尔可夫链模型
、
、
、
、
我想
使用
numpy找到状态
向量
(我也尝试了
使用
相同的函数)。所以,我认为这应该给出优势左特征值的
特征向量
。此外,sstate
向量
包含所有复数。现在,为了检查这是否正确,我执行以下矩阵乘法:如果操作正确,这将返回与“sstate.‘”相同的
向量
。我不知道为什么这不管用。在我的过渡状态矩阵
中
的每一行和列被认为是1,然而,我发现舍入错误导致每一行和列和仅为1。 任何和所有
浏览 1
提问于2015-02-13
得票数 4
回答已采纳
1
回答
在
使用
` `
sklearn
`‘模型时需要附加偏差项吗?
、
、
在我的机器学习课上,我们学习了在
使用
许多机器学习模型来解释偏差时,
如何将
1添加到每个样本的
特征向量
中
。例如,如果我们正在进行线性回归,并且样本具有f_1,f_2,...,f_d特征,我们需要添加一个“伪”特征值1,
以
允许回归函数不必通过原点。 当
使用
sklearn
模型时,你需要自己做这件事,还是他们的实现为你做呢?具体来说,我感兴趣的是,在
使用
他们的任何回归模型或SVM模型时,这是否是必要的。
浏览 0
提问于2016-05-10
得票数 0
1
回答
SKLearn
感知器在
稀疏
和密集时的行为不同
、
、
、
当给出密集格式的矩阵时,与
稀疏
格式的相同矩阵相比,Perceptron给出了不同的结果。我认为这可能是一个洗牌的问题,所以我
使用
来自cross_validate的
sklearn
.model_selection进行了交叉验证,但没有成功。 也讨论了一个类似的问题。但也有一些理由。我
使用
Perceptron的参数是:penalty='l2', alpha=0.0001, fit_intercept=True, max_iter=10000, tol=1e-8, shuffle=True, verbose=0
浏览 3
提问于2017-10-19
得票数 1
回答已采纳
2
回答
从
稀疏
矩阵中提取I和j
、
我可以
使用
i、j和x的
向量
定义一个:j <- c(2,9,6:10)(A <- sparseMatrix(i, j, x = x))i <- A@i + 1(请注意,i和x的顺序发生了变化,但它们的相对关联是相同的: i=4仍然处于与x=21相同的位置) 然而,
稀疏
矩阵的最后
浏览 10
提问于2014-01-13
得票数 2
回答已采纳
2
回答
关于多探测局部敏感散列的问题
、
、
、
、
很抱歉问这种菜鸟问题,但是因为我真的需要一些关于如何
使用
多探针LSH的指导,所以我自己没有做太多的研究。我知道有一个名为LSHKIT的库可以实现该算法,但我在尝试如何
使用
它时遇到了麻烦。现在,我有几千个
特征向量
296维,每个
特征向量
代表一个图像。该
向量
用于查询用户输入图像,
以
检索最相似的图像。我用来推导
向量
之间距离的方法是欧几里德距离。您可以
使用
text2bin来设置拟合数据的数据格式。文本文件包含图像或音频文件的
特征向量
,每行代表一
浏览 1
提问于2010-04-04
得票数 6
回答已采纳
1
回答
如何在SGNN (自治神经网络)
中
实现哈希?
、
、
、
、
我认为这是第一次对单词的字符进行处理,
以
获得文本
中
单词的特征表示,因此,
以
4克为例,您可以生成一个1M维的
稀疏
特征向量
。希望它是
稀疏
的,所以内存不需要被充分
使用
,因为它几乎是一个热点(或计数
向量
化,或tf-国防军
向量
化,有大量的零)。 然后,您需要
使用
散列那些n克
稀疏
向量
。据我所知,他们似乎
使用
了。另外,他们
使用
的不是ngram
向量<
浏览 0
提问于2018-12-20
得票数 3
1
回答
文档分类
中
的枕/学习
稀疏
矩阵分解
、
、
、
、
我试图对一个大型的语料库(4000个文档)进行文档分类,并在
使用
标准的scikit学习方法时不断地遇到内存错误。经过清理/堵塞我的数据,我有一个非常
稀疏
的矩阵,大约100万字。我的第一个想法是
使用
sklearn
.decomposition.TruncatedSVD,但由于内存错误,我无法
使用
足够大的k来执行.fit()操作(我所能做的最大操作只占数据方差的25% )。i想要手动进行核外矩阵变换,将PCA/SVD应用到矩阵
中
以降低维数,但需要一种方法来首先计算
特
浏览 8
提问于2014-10-08
得票数 1
1
回答
Python的PCA :
特征向量
不是正交的
、
、
、
我的理解是,主成分(即协方差矩阵的
特征向量
)总是相互正交的。这也是维基百科的图片: 维基百科图片的描述(): 多元高斯分布的主成分分析
以
(1,3)为中心,在( 0.878,0.478 )方向的标准偏差为3,在正交方向上的标准差为1。所示的
向量
是由相应特征值的平方根标度的(对称的,正半定的)协方差矩阵的单位
特征向量
。就像在一维情况下一样,平方根被取下来,因为标准差比方差
更
容易可视化。所以我认为,对于我的情况,如果我画出我从随机数据
中
得到的
特征向量
,也是正交的。但事
浏览 11
提问于2021-12-18
得票数 1
回答已采纳
3
回答
存储和比较生物特征信息
、
、
一般来说,我们在计算机应用程序中
使用
生物识别技术,比如用于身份验证。让我们来看两个指纹和面部识别的例子。 在这种情况下,我们如何保存信息
以
进行比较。例如,我们不能保留图像并每次都对其进行处理。那么,在这种情况下,我们
使用
什么方法来存储/确定相似性呢?有没有为此目的而设计的特殊算法?(例如:每次为某个人的指纹返回大致相等的值)
浏览 1
提问于2009-09-07
得票数 2
回答已采纳
点击加载更多
相关
资讯
高效大规模图像搜索开源实现
主成分分析算法原理与实现
MIT用AI实现3分钟自动抠图,精细到头发丝,秒杀一切PS软件
特征工程(一)
高维向量压缩方法IVFPQ :通过创建索引加速矢量搜索
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券