腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
特征
选择对决策树算法有影响吗?
machine-learning
、
feature-selection
、
decision-trees
背景:目前,我正在从事我的论文项目,即建立基于树的集成方法,用于在一个大
数据
集上进行分类。在我开始建模之前,我花了大量的时间在
特征
选择上,使用基于相关性的标准来选择一个
特征
子集,这样这些选择的
特征
与响应变量有很高的相关性,并且彼此之间的相关性很低。然而,我的一位主管问我为什么花那么多时间在
特征
选择上,正如他提到的,决策树算法可以自然地选择哪些
特征
是最重要的。后来,我查阅了Tan (2014)的“
数据
挖掘
入门”一书,书中明确指出,“
特征
浏览 0
提问于2019-05-08
得票数 9
1
回答
数据
科学能应用于建立文本的作者吗?
data-mining
是否有
数据
科学或机器学习技术可以帮助建立作者身份?
浏览 0
提问于2016-06-19
得票数 0
1
回答
特征
选择/属性选择-整体表现良好
attributes
、
statistics
、
classification
、
feature-extraction
、
feature-selection
在一项大规模的
数据
挖掘
基准研究中,我比较了9个
数据
集上的15个算法,最终得出了135个算法/
数据
集的整体组合。这项研究是用WEKA完成的。虽然问题太大,以寻找最优的
特征
选择算法为每一个组合,我正在寻找那些被认为是一个良好的性能,总的来说,可以这么说。到目前为止,我
发现
推荐CFS (基于相关的
特征
选择)
浏览 2
提问于2013-09-17
得票数 0
回答已采纳
1
回答
构建一个文本分析软件有什么好的建议吗?
text
、
analysis
有没有办法检查文本中的情绪?我试图建立一个聊天客户端,应该可以分析文本,并能够确定用户的情绪
浏览 1
提问于2013-07-18
得票数 0
1
回答
GraphDb -创建产品目录的最佳实践
rdf
、
owl
、
ontology
、
graphdb
我想有一个
数据
库,我可以在那里搜索,排序,显示相关的模型等。 问题:产品来自不同的来源(web
挖掘
、表格
数据
等)。每个品牌都有一些“集合”,每个集合都有模型和变体。每个品牌使用不同的名称来表示模型的
特征
。因此,我可以在我的目录中找到具有不同名称的相似
特征
。问:我试着阅读用例,我
发现
这(https://www.ontotext.com/knowledgehub/case-studies/edamam-mines-web-data/
浏览 17
提问于2020-04-09
得票数 0
1
回答
人工智能、ML、神经网络、深度学习和
数据
挖掘
的区别
artificial-intelligence
、
machine-learning
、
neural-networks
、
data-mining
它是ML的超集 ML是AI的特定领域,它帮助开发基于样本
数据
(训练
数据
)的程序,而不是硬编码规则/编程(如求和/乘法)。机器学习基本上是从过去的
数据
中学习,然后预测/分类给定的输入。在ML中,软件前端知道训练
数据
的
特征
及其输出分类,而在DL中,算法本身识别训练
数据
的相关
特征
/属性。NN:- -神经网络是用于机器学习的一组特定算法,它使用人工神经元的图形对
数据
建模,这些神经元是“模仿大脑中的神经元如何工作”的数学模
浏览 0
提问于2018-03-04
得票数 3
回答已采纳
1
回答
给定一个形状为(num_samples,num_features)的稀疏矩阵,如何估计共生矩阵?
python
、
machine-learning
、
data-mining
稀疏矩阵在每个条目
特征
处只有0和1 (1代表样本具有
特征
j)。给定
数据
点的这种稀疏表示,我如何估计每个
特征
的共生矩阵?特别是,我希望找到在至少50个样本中共同出现的
特征
对。我意识到可能很难产生确切的结果,
数据
挖掘
中有没有什么近似算法可以让我做到这一点?
浏览 1
提问于2017-04-04
得票数 0
3
回答
评估
数据
挖掘
工具的行业基准
comparison
、
benchmarking
、
data-mining
我正在寻找一个项目的
数据
挖掘
工具,为了符合这一点,我已经在SO上发布了另一篇文章。我目前正在研究不同的工具,我想知道是否存在任何行业基准来评估不同的
数据
挖掘
工具,以便我可以参考它来对工具进行更好的评估。干杯
浏览 2
提问于2009-05-09
得票数 1
回答已采纳
1
回答
如何保存稀疏
数据
集以供scikit-learn使用?
java
、
python
、
scikit-learn
我正在写一个java文本
挖掘
工具。我想用scikit-learn分类器测试我的
数据
集。我使用Java动态创建
特征
向量,向量非常稀疏。我想将我的稀疏向量/
数据
集导出为一种可以轻松与scikit-learn一起使用的格式。我已经用Java语言编写了一个导出函数,将
数据
集导出为ARFF格式,但我
发现
用scikit-learn无法读取它。有一些用于ARFF文件的python解析器,但它们不支持稀疏
数据
集。 即哪种格式?!
浏览 5
提问于2015-05-15
得票数 0
1
回答
查找变量之间的关系
machine-learning
、
pattern-matching
、
pattern-recognition
还有一个
特征
向量,它是所有
特征
的并集。我对
特征
向量进行了建模,如下所示。0-
特征
向量中缺少该
特征
。我必须找出以下变量之间的关系1011010110101100这里,所有程序中的关系是0、1和5位置不变,即它们所代表的
特征
倾向于继续。考虑到如此庞大的
数据
集,是否有任何机器学习/
数据
挖掘
方法可以找到它们之间的关系。
浏览 1
提问于2015-06-11
得票数 0
1
回答
one-hot编码会导致功能不均衡的问题吗?
machine-learning
、
scikit-learn
、
data-mining
、
one-hot-encoding
、
feature-engineering
我们知道,在
数据
挖掘
中,我们经常需要对分类
特征
进行一次性编码,因此,一个分类
特征
将被编码为几个"0/1“
特征
。有一个特例让我感到困惑:现在我的
数据
集中有一个分类
特征
和一个数字
特征
,我将分类
特征
编码为300个新的"0/1“
特征
,然后使用MinMaxScaler对数字
特征
进行归一化,因此我的所有
特征
值都在0到1的范围内但可疑的现象是,分类
浏览 2
提问于2018-12-03
得票数 0
1
回答
在一个
数据
集上使用两个不同的回归模型来预测单个标签
python
、
pandas
、
machine-learning
、
regression
、
sklearn-pandas
我想在文本
挖掘
的
特征
上使用KNN,同时对我的其余
特征
使用另一种回归。有没有可能以某种方式组合两个回归模型来预测单个标签?我应该把我的
数据
集分成两个不同的吗?
浏览 0
提问于2019-05-18
得票数 0
4
回答
数据
科学和
数据
挖掘
是一样的吗?
data-mining
、
definitions
我确信,在这个论坛上将讨论的
数据
科学有几个同义词,或者至少是分析大量
数据
的相关领域。 我的特别问题是关于
数据
挖掘
。几年前我上过
数据
挖掘
研究生班。
数据
科学和
数据
挖掘
之间有什么区别,尤其是我还需要看什么才能精通
数据
挖掘
?
浏览 0
提问于2014-05-14
得票数 26
回答已采纳
1
回答
使用Weka处理关联规则缺少的值
data-mining
、
weka
、
apriori
我有一个
数据
集,大约有13个特性(都是二进制的)。其中一些特性仅适用于一小部分
数据
。当我使用Weka运行关联规则
挖掘
时,它基于
特征
值为0 (0意味着
特征
不适用)来识别属性之间的强相关性。我希望这种相互关系只被确认为积极的
特征
。我该怎么做?
浏览 3
提问于2014-06-02
得票数 1
回答已采纳
1
回答
利用神经网络进行
数据
分析
c#
、
neural-network
、
encog
、
accord.net
是否有可能使用神经网络(encog/co-.net)将时间-压力
数据
和常数与预期的输出相结合, 以便程序能够根据不同的时间压力
数据
和不同的常数值来估计输出?
浏览 2
提问于2013-11-13
得票数 1
回答已采纳
1
回答
如何提取实体和实体间关系的抽象?
rapidminer
、
gate
我想使用rapidminer或gate来提取关于实体(角色)(或者只是主要
特征
)以及故事中实体之间关系的抽象。你有没有我可以修改的想法或样本?我试图使用像Aylien和Rosette这样的快速
挖掘
器扩展,但提取实体操作符询问属性参数,而我无法
发现
它的值是什么?到哪里去买呢?
浏览 4
提问于2018-05-27
得票数 0
6
回答
关联规则
挖掘
和频繁项集
挖掘
的区别是什么
data-mining
我是
数据
挖掘
的新手,对关联规则和频繁项
挖掘
感到困惑。对我来说,我认为两者都是一样的,但我需要这个论坛上专家的意见关联规则
挖掘
和频繁项集
挖掘
有什么区别?谢谢
浏览 2
提问于2010-06-16
得票数 12
回答已采纳
1
回答
什么是知识
发现
和
数据
挖掘
?
sql-server
、
sql-server-2005
、
algorithm
、
data-mining
我认为SQL查询获取的是“原始
数据
”...在MS-SQL server 2005、2008中有没有可用的KDD即用算法?
浏览 0
提问于2009-11-14
得票数 2
回答已采纳
2
回答
音乐
特征
提取/音乐信息检索工具
machine-learning
、
data-mining
我正在着手一个关于使用
数据
挖掘
和机器学习算法进行音乐
特征
提取和信息检索的项目。你能给我推荐一些同样的工具吗?首先我们专注于
特征
提取工具,我找到了像jAudioSymbolic extractor,Yaafe,openSmile..Can这样的工具,你能告诉我更多的工具,也许你对某个特定工具的发展有什么建议?
浏览 0
提问于2012-08-30
得票数 2
3
回答
统计、机器学习和
数据
挖掘
statistics
、
machine-learning
、
data-mining
我目前正在学习
数据
挖掘
,我有以下问题。 我
发现
许多
数据
挖掘
技术都与统计相关,而“听说”
数据
挖掘
与机器学习有很多关系。如果它们不是密切相关的,那么是否有这样的分工,将侧重于统计技术的
数据
挖掘
与以机器学习技能为重点的
数据
挖掘
分开?因为我
发现
一些研究生院的统计学系开设了
数据
挖掘</
浏览 8
提问于2011-09-21
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
《魔兽世界》8.0数据挖掘发现新种族 玛格汉兽人
数据挖掘发现《超级马里奥:奥德赛》还有大量服
《数据挖掘技巧》,如何从大数据环境下,发现那些审计疑点
基于数据挖掘的过敏性紫癜患儿舌象特征分析
数据挖掘发现《绝地求生》豹纹短裙
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券