腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
哪个统计测试显示哪个分类器的性能优于其他分类器?
machine-learning
、
classification
、
statistics
、
performance
、
descriptive-statistics
我有三个分类器: A,B和C,根据准确性、特异性、敏感性、f评分和g均值,例如分类器B表现最好.现在我想从统计学上证实这个说法。我怎么发动汽车呢?McNemar的测试是否足以验证它?哪个统计测试会告诉我哪个分类器比其他分类器更好?又是如何做到的?
浏览 0
提问于2019-12-20
得票数 7
1
回答
weka模型的奇数结果
java
、
weka
我正在使用Weka,我想按照类{男性,女性}来分类我的数据。我使用MultiBoostAB分类器和REPTree分类器作为基础。我试图使用训练集(557个实例)来评估我的分类器的准确性。 然后是一个具有大约300个属性的测试集(200个实例)。分类正确率为83 5%~ 167例,kappa统计量为0 67。我保存了这个模型,我用它来预测 标签(男性或女性)的其他未知数据,得到了几乎相同的好结果。然后,我将训练集的大小增加到1000个实例,看看是否可以提高分类器的准确率。我得到了以下结果: 运行一个包含360个实例的测试集--> 87.0423 %正确分类实例和kappa统计量0,73
浏览 3
提问于2013-05-23
得票数 1
回答已采纳
1
回答
如何根据Drupal中的cck字段数据统计节点
drupal
、
views
、
cck
带有cck复选框的节点需要根据cck数据统计节点,并通过视图字段显示 在drupal6 +分类法中-有一个简单而快速的函数taxonomy_term_count_nodes(),但我正在考虑通过d7自定义字段不带分类法的cck 有没有基于CCK文件统计节点的API函数?
浏览 0
提问于2010-07-05
得票数 0
1
回答
有产品拍照识别,并核对目录产生分类库存的文档的软件开发能力吗?
产品
、
软件开发
、
统计
我公司有大量产品无法分类统计库存,想要有一个可以拍图生成产品目录, 后期配送时拍图分类上货帐 可否实现
浏览 339
提问于2020-03-09
1
回答
二元分类任务pearson r统计量的类比
classification
我试图了解数据中的变量是如何与目标变量(二进制类)相对应的。 在回归中,Pearson r统计量很好地得到了变量间的关系。此外,我还可以使用它进行分类,将类0和1作为实值处理,但这是一个危险的技巧。 我的问题是:是否有类似的统计数据说哪个变量对分类任务有好处?谢谢
浏览 0
提问于2016-12-28
得票数 2
回答已采纳
1
回答
随机森林中重要特征的统计意义?
python
、
scikit-learn
、
random-forest
我有一个随机的森林分类器,它给了我一个特征重要性排名。 我如何才能得出重要特征的统计意义,就像你可以推断betas的统计意义的回归模型一样?
浏览 0
提问于2018-07-24
得票数 0
1
回答
使用单独分类器模型的Weka实验选项卡验证结果
machine-learning
、
weka
、
mean-square-error
、
kappa
我在同一数据集上运行了不同的分类器。在运行分类器之后,我得到了一些统计值。 这是所有分类器的摘要 ? 我正在使用Weka来训练模型。Weka本身有一种方法来比较不同的算法。为此,我们需要使用Experiment选项卡。对于相同的数据集,我也使用了这个选项。 Weka给了我使用实验选项卡时Kappa统计的结果 ? 均方根误差为 ? 相对绝对误差 ? 诸如此类…… 现在我不能理解我从实验选项卡中获得的值与我在第一张图片的表格格式中共享的值有什么相似之处?
浏览 30
提问于2021-11-01
得票数 0
回答已采纳
1
回答
只使用一个特征来构建学习模型有意义吗?
machine-learning
、
genetic-programming
、
adaboost
、
supervised-learning
为了提高adaboost分类器(用于图像分类)的准确性,我正在使用遗传编程来派生新的统计度量。每次生成新特征时,我都会通过训练adaboost分类器并测试其性能来评估其适用性。但我想知道这个过程是否正确;我的意思是使用单个功能来训练学习模型。
浏览 0
提问于2013-06-21
得票数 1
回答已采纳
2
回答
在Statsmodels中是否实现了套索回归?
python
、
regression
、
statsmodels
、
lasso-regression
我喜欢在统计模型中使用线性套索回归,以便能够使用“公式”符号来编写模型,这将为我在处理许多分类变量及其交互时节省相当多的编码时间。然而,它似乎还没有在统计模型中实现?
浏览 1
提问于2017-04-17
得票数 11
回答已采纳
1
回答
使用ASP.NET显示Webalizer统计信息
asp.net
、
shared-hosting
、
web-analytics
、
webalizer
我有一个网站(www.teahua.com)是用ASP.NET (2.0)和C#编写的,运行在使用mono的Debian服务器上。托管提供商使用webalizer提供网站统计数据。 可以通过www.teahua.com/stats访问统计数据(它会运行index.html页面)。 我是ASP.NET领域的新手。我的问题是,如何使用ASP.NET显示/包含统计页面以及该页面的所有其他链接。 谢谢你的帮助
浏览 7
提问于2011-06-05
得票数 1
1
回答
开放vSwitch中的grep分类器是什么意思?
grep
、
mininet
、
openflow
、
openvswitch
当我想显示流表统计数据时,我使用ovs-ofctl dump-tables s_id。有时我注意到“grep分类器”用作(ovs-ofctl dump-tables s_id | grep classifier)。grep分类器是什么意思? 谢谢。
浏览 4
提问于2016-12-12
得票数 0
1
回答
分类器
artificial-intelligence
、
machine-learning
、
classification
、
cluster-analysis
我实现了一个分类器 每次迭代都接收一个参数对象进行分类,一些对象共享一个可分类的“属性”,就像一个颜色名称。 分类参数可能会发生变化,因此它们也会被参数化,并在初始化时传递给该分类器。 分类器根据可能的分类类型和要分类的对象实现分类逻辑。 我对一些文章中使用的词汇表感到非常困惑:,。 这是一种常见的分类器吗?在我的方法中,我没有看到向量,没有统计分类,没有分级分类,没有机器学习等等。 哪种分类器是计算机科学文献的分类器?
浏览 3
提问于2011-10-03
得票数 1
回答已采纳
2
回答
如何用python对英语单词进行分类?
python
如何用python对英语单词进行分类?比如国家和政府:政权,政治,政治家,官员,democracy......besides,还有其他的话题:教育/家庭/经济/学科等等。 我想整理“经济学人”杂志的词汇,并根据频率和主题对这些进行分类。目前,我已经完成了单词的频率统计,下一步是如何用python自动对这些单词进行分类?
浏览 9
提问于2020-04-14
得票数 0
1
回答
生成模型在机器学习分类应用中如何应用?
machine-learning
、
classification
、
generative-models
我对生成模型的理解是,它们生成的数据与某些统计属性相匹配。直觉上,我发现如何将生成模型用于分类目的是很困难的。另一方面,用于分类的判别模型是不言自明的.
浏览 0
提问于2018-09-03
得票数 1
回答已采纳
1
回答
如何创建节点信息栏(或节点信息块)?
theming
、
nodes
、
8
、
navigation
我想要创建一个包含三个部分的挑逗: 职称科。 信息科(信息栏): 这个节点什么时候写的?(日期及时间) 谁写了这个节点:(Node的作者) 什么类别包括:(分类或分类)。 浏览了多少次(节点视图统计)。 有多少人添加注释(注释统计)。 只显示“阅读更多”链接:在节点的底部挑逗,删除或取消其他链接,如“添加新评论”、"2新评论“、"2评论”,在节点挑逗结束时,因为我认为人们对他们尚未阅读的内容发表评论是没有道理的。 我想要达到的目标如下: 📷
浏览 0
提问于2016-06-27
得票数 0
回答已采纳
1
回答
如何按分类顺序处理多源能源的时间序列?
machine-learning
、
classification
、
time-series
我想对多源能源(风能/太阳能/teg)进行分类,并在时间序列数据中加以说明。我的问题是: 1-最相关的特征是什么,我应该选择做分类(统计的(kurtoisis/意思/方差.)对于每个滑动窗口(用于实验)或光谱窗口(DWT/FFT),在这种情况下,特征选择/提取方法是最好的。2-我应该选择的最佳分类方法是什么? 谢谢
浏览 0
提问于2017-04-11
得票数 1
回答已采纳
4
回答
潜在语义索引(LSI)是一种统计分类算法吗?
algorithm
、
semantic-web
、
information-retrieval
、
classification
潜在语义索引(LSI)是一种统计分类算法吗?为什么或者为什么不? 基本上,我想弄明白为什么没有提到大规模集成电路。我刚刚进入这个领域,我试图了解所有不同的分类方法是如何相互联系的。
浏览 1
提问于2009-10-28
得票数 2
回答已采纳
1
回答
在CNN的背景下,什么是统计的平稳性?
deep-learning
、
conv-neural-network
、
imagenet
我当时正在读AlexNet的论文(即“用深层卷积神经网络进行ImageNet分类”)。引言部分将“统计的平稳性”和“像素相依的局部性”作为卷积神经网络的两个强有力的假设。我知道后者指的是图像中局部模式的存在,但“统计平稳性”的含义是什么?
浏览 1
提问于2018-12-08
得票数 2
1
回答
什么是适合于多类分类的统计显着性检验?
statistics
、
multiclass-classification
、
performance
、
f1score
我有一个多等级的分类问题。我主要是使用宏观平均F1度量来评估模型的性能,并希望验证这些结果是否具有统计学意义。我有两个分类器在相同的训练/测试集(配对观察)的结果。 一些消息来源建议使用McNemar的测试来完成二进制分类任务。然而,对于多类分类问题,McNemar的测试有什么推广吗?如果是的话,进行这些测试的适当程序是什么?
浏览 0
提问于2020-11-15
得票数 2
回答已采纳
1
回答
kNN是一个统计分类器吗?
algorithm
、
machine-learning
、
classification
、
weka
、
knn
我目前正在为我的人工智能考试做一个机器学习项目。我们的目标是正确选择两种使用WEKA进行比较的分类算法,同时考虑到这两种算法必须有足够的不同,才能给出进行比较的理由。此外,算法必须同时处理名义数据和数字数据(我认为这是必须的,以便进行比较)。例如,我的教授建议选择统计分类器和决策树分类器,或者深入研究自下而上分类器和自顶向下分类器之间的比较。 由于我在机器学习领域的经验很少,我正在对WEKA提供的各种算法进行一些研究,我踩到了kNN,即k近邻算法。是统计数据吗?举个例子,它能与决策树桩算法进行比较吗? 或者,您能提出几个符合上述要求的算法吗? 处理的数据必须是数字的和名义的。在WEKA上有数值
浏览 3
提问于2016-04-05
得票数 1
回答已采纳
1
回答
如何在统计分析的基础上选择模型?
deep-learning
、
statistics
、
performance
、
descriptive-statistics
我已经在统计学上验证了不同的深度学习模型对寄生细胞和正常细胞的分类性能。在这个过程中,我可以发现,在统计学上没有显着的差异,在性能之间的预处理CNN模型。在没有这种意义的情况下,我应该选择哪一种模式?
浏览 0
提问于2017-12-29
得票数 1
回答已采纳
1
回答
如何在快速挖掘器中获得Logistic回归的汇总统计?
logistic-regression
、
rapidminer
我是RapidMiner界面的新手,我想根据p值来确定我的分类模型中的变量是否重要。 在R中,我执行此summary(model)操作,并将获得包含p, t & standard error values的汇总统计信息。 但我在RapidMiner界面中找不到同样的东西。哪个操作员会给我这个汇总的统计数据。
浏览 21
提问于2018-01-22
得票数 0
回答已采纳
1
回答
有没有办法在蟒蛇中使用分类pca?
python
、
statistics
、
pca
、
categorical-data
我需要构造一个索引,其中包括一个调查中的几个分类变量。为了计算每个变量的权重,我想使用一种统计方法,例如PCA。主成分分析被认为是对连续数据进行的,然而,对于分类变量CatPCA有一个修正的主成分分析。在python中有什么包可供阅读吗? 或者,如果没有,还有什么其他方法可以用分类变量来构造索引吗?
浏览 12
提问于2022-04-25
得票数 0
1
回答
多元时间序列分类
machine-learning
、
neural-network
、
classification
、
deep-learning
、
time-series
我有大约72,000多变量时间序列(MTS),具有四维,长度约为3000毫秒(非恒定)。它是(4*3000*72000) DLN。这个MTS有两个可能的结果,要么通过,要么失败。 如何选择更符合以上标准的分类器? 我读过一些MTS分类的实现。我不能应用距离测量技术进行分类,因为与其他MTS相比,数据太长且不是常数。 我正在考虑应用以下技术进行分类。 1)从数据中提取全局统计特征并应用任何分类器(KNN或随机森林或神经网络) 什么是最好的方法。请指导我更好的技术,我也开放其他技术分类MTS。
浏览 0
提问于2017-07-08
得票数 2
1
回答
Git提交分类
git
、
github
、
statistics
、
gitlab
、
classification
我想可视化我们项目中提交的统计数据。我想根据一些指标将它们分成几个组,比如提交消息或更改代码行数。 我能用什么系统的方法吗?我在为提交消息分类选择正确的关键字和为大小分类选择合适的阈值方面有困难。
浏览 1
提问于2020-02-07
得票数 1
回答已采纳
1
回答
从ASP.NET C#中的Amazon获取电子邮件统计数据
c#
、
asp.net
、
amazon-sqs
、
amazon-sns
、
amazon-ses
我现在可以发送批量电子邮件与AWS服务。现在我想得到我发过的所有这些邮件的每封邮件的统计数据 我想在用ASP.NET C#开发的仪表板上显示每个电子邮件统计信息。 每封邮件,我如何才能得到发送,传递,封锁,打开,点击统计数据。 我可以访问、SNS、和SQS服务。怎么才能帮到我?如何使用ASP.Net C#从亚马逊获取这些统计数据?我需要像那样使用他们的SDK还是web钩子? 我需要遵循什么逻辑才能做到这一点?
浏览 0
提问于2019-01-25
得票数 0
1
回答
分类学术语页面访问报告
taxonomy-terms
、
7
、
log-messages
是否有任何模块可以跟踪分类术语的页面访问计数? 有几个模块用于节点访问报告(包括核心统计)。但我没有发现任何分类学术语页面访问计数。 一些帖子建议为此目的使用谷歌分析模块。但是我的客户不想使用,因为这是内部网站点。仍然想要一个类别页面访问的报告。
浏览 0
提问于2014-11-19
得票数 1
1
回答
多个数据集上多个算法的统计检验
machine-learning
、
statistics
、
multiclass-classification
我是这方面的新手。在使用统计测试对算法进行比较时,我面临一些问题。本文给出了几种分类算法的Gmean结果。鲍鱼、平衡秤、Car、国际象棋是这里的数据集,ROS、RUS、RFS、NoS是算法. 如果我想用一些统计检验(如t检验、Friedmen检验、Wilcoxon检验等)来比较哪个数据集比其他数据集更好,那么我能用下表比较算法吗? ROS RUS RFS NoS Abalone 0.003 0.0036 0.0039 0 Balance-scale 0.8858 0.8065 0.8
浏览 0
提问于2020-01-10
得票数 2
3
回答
请帮我选择正确的分类器
artificial-intelligence
、
machine-learning
、
data-mining
、
classification
我正面临着为我的数据挖掘任务选择正确的分类器的问题。 我正在使用统计方法标记网页,并使用1-4级来标记它们,1是最差的,而4是最好的。 以前,我使用支持向量机来训练系统,因为我使用的是二进制(1,0)标签then.But现在由于我切换到这个4类标签,我需要改变分类器,因为我认为支持向量机分类器只适用于两类分类(如果我错了,请纠正我)。 因此,您能否在这里提供一些建议,哪种分类器最适合我的分类目的。 提前感谢您的建议。
浏览 0
提问于2010-10-11
得票数 4
回答已采纳
1
回答
决策树-非常稀疏特征的预处理
decision-trees
、
preprocessing
如何为决策树的稀疏特性预处理数据? 从这个决策树的Turi文档 它提到这一点: 为什么选择决策树?不同的型号有不同的优点。决策树模型非常擅长处理具有数值特征的表格数据,或少于数百个类别的分类特征。与线性模型不同,决策树能够捕捉特征与目标之间的非线性交互.一个重要的注意事项是,基于树的模型的设计并不是为了处理非常稀疏的特性。当处理稀疏输入数据(例如大维分类特征)时,我们可以对稀疏特征进行预处理以生成数值统计数据,也可以切换到更适合这种情况的线性模型。 如果我们有一个非常稀疏的分类列(许多0's),那么对于这个类别,我们可以对每一行转换什么类型的数字统计?
浏览 0
提问于2019-03-07
得票数 2
1
回答
python代码,用于比较句子对,并查看它们是否在文本文件中的相同或不同块中
python
、
nlp
我有两个文本文件。编写Python程序1)我需要比较第一个文件中的句子对,看看它们是否在相同或不同的块中,并与第二个文本文件进行比较。2)我需要计算正确分类的百分比。3)我需要统计:正确分类为同一块的句子对的百分比,正确分类为不同块的句子对的百分比
浏览 12
提问于2020-07-22
得票数 0
3
回答
关于使用机器学习工具Weka的问题
machine-learning
、
data-mining
、
classification
、
weka
我正在使用Weka的资源管理器功能进行分类。 所以我有我的.arff文件,有两个数值特征,我的类是一个二进制的0或1(例如{0,1})。 示例: @RELATION summary @ATTRIBUTE feature1 NUMERIC @ATTRIBUTE feature2 NUMERIC @ATTRIBUTE class {1,0} @DATA 23,11,0 20,100,1 2,36,0 98,8,1 ..... 我加载这个.arff文件,使用10折交叉验证(没有测试文件),然后选择NaiveBayes,然后我对数据进行分类,结果显示:5个标签错误,100个标签正确。到目前一切尚好。
浏览 4
提问于2009-11-27
得票数 4
回答已采纳
1
回答
谷歌分析iframe+query字符串跟踪
google-analytics
、
query-string
、
multiple-domains
我想知道有没有人能给我指个方向? 我在us.website.com上有一个iframe,嵌入在www.website.com上的一个页面中-我需要跟踪us.website.com页面在谷歌分析中的每个查询字符串。 即 我将查询字符串数据从URL (地址栏)传递到iframe,这样当提交表单时,跟踪代码就可以识别用户来自哪里。 src= source1 (表单传递source1作为条目源) www.website.com/offers/offer.html?src=source2 (表单传递source2作为条目源) 目前,(us.website.com/offers/offer.asp)的所有
浏览 3
提问于2013-08-15
得票数 1
1
回答
使用遗传算法跟踪WordPress中流行的标记/类别
google-analytics
、
wordpress
、
analytics
我协调了几个编辑内容驱动的网站,这些网站是在WordPress中建立的。大多数人大量使用标签、分类和自定义分类法。我想要跟踪哪些标签/类别最受欢迎,保留访问者等。不仅仅是导航页面,还包括帖子本身。 例如,我想知道类别中的帖子是否比其他帖子更受欢迎。目前,我这样做的唯一方法是根据类别概述进行概括,或者手动统计所有个别的post数据。我们已经尝试过在post标题中使用关键字和使用自定义的post类型,但这太有限了。 默认情况下,这种特定于WP的跟踪在遗传算法中是很难做到的。文章中有一个url,它不包含类别或标签。考虑到一个帖子可以属于几个分类术语,这是有意义的。如果一个帖子的url通过简单的更改/
浏览 0
提问于2013-06-15
得票数 1
1
回答
Google与ASP.MVC 5和AngularJS的集成
c#
、
asp.net-mvc
、
angularjs
、
google-analytics
、
google-analytics-api
我正在开发一个项目,使用ASP.MVC 5 (C#)和AngularJS从获取网站统计数据。我不知道该怎么开始。请指导我从这个项目开始。我需要用什么东西?(API键等) 我已经有一个谷歌帐户与谷歌分析统计。我将使用ASP.MVC 5 (C#)和AngularJS开发它。
浏览 3
提问于2015-08-11
得票数 0
回答已采纳
2
回答
使用新的Azure机器学习进行匹配
azure
、
azure-machine-learning-studio
有没有人有使用Microsoft Azure中的新进行匹配的示例? 进行分类的示例很有意义,我想知道是否有使用内置工具进行匹配的示例。这将代替使用分类并将其与我自己的自定义代码进行比较。无论哪种方式,一个例子都很好。 我想根据位置、人口统计数据等匹配两个不同的实体。
浏览 0
提问于2014-10-09
得票数 3
1
回答
使用描述性统计信息生成数据框架
r
、
r-markdown
当我将标记文件编成pdf文件时,我想要生成一个包含描述性统计数据的表,当我将标记文件编成pdf文件时,这些统计数据“很容易看”。我的数据包括许多范畴(19)以及连续(6)变量。 更具体地说,我发现xtable是一个整洁干净的表,我更希望找到一种方法来创建一个包含分类变量和连续变量的描述性表。 更新:,我在这方面做了更多的工作,在收到一些评论之后,我试图重新构建问题,这样就变得更加清晰了。 我想要做的是创建一个由所需的摘要统计数据组成的数据框架(给定变量的特性)。然后,当我把我的xtable编成pdf时,我想用rMarkdown把它做成一个整洁的桌子。 因此,我的问题是:如何创建一个函数,为每个
浏览 1
提问于2020-08-14
得票数 0
2
回答
使用when实体方法时的编码问题
php
、
encoding
我在php中有一个字符编码问题,所以这是php代码: n_event=$_GET['ndlann']; $nom_complet=htmlentities(stripslashes($_POST['nom'])); $email_comment=htmlentities(stripslashes($_POST['email'])); $titre_comment=htmlentities(stripslashes($_POST['titre'])); $texte_comment=htmlentities(stripslashes
浏览 0
提问于2011-01-25
得票数 4
回答已采纳
1
回答
4级分类的统计标准是什么?
machine-learning
、
statistics
、
classification
、
multilabel-classification
我有4类分类任务,我用机器学习分类器(SVM等)来解决。 哪一种统计方法可以用于4类?我肯定会使用p值(用置换测试),但我需要更多。 一些有趣的指标是真阳性率、真阴性率、阳性预测值、阴性预测值,在ROC曲线下,在PR曲线下。但我认为这只适用于两节课。
浏览 5
提问于2015-06-06
得票数 2
回答已采纳
1
回答
分类数据分离方法
python
、
statistics
嗨,我对Python有点陌生,我认为最好的学习方法是尝试我的大学,SAS和Python的R项目。然而,我很难获得分类数据的汇总统计数据,,我正试图使用'WREN_AVG =df‘’WREN‘. find ()之类的方法为每一个物种获得不同的统计数据,但这不起作用,而且我似乎找不到解决办法。 我目前正在使用numpy,matplotlib,熊猫和海运。
浏览 4
提问于2020-08-07
得票数 0
回答已采纳
2
回答
python函数通过某些分类器来填充缺失的值,比如算法?
python
、
machine-learning
、
scikit-learn
、
missing-data
我想以一种“智能”的方式用python输入丢失的数据。 我已经学习了scikit--通过“平均”和“中值”来计算熊猫,但是我希望通过机器学习、统计算法、分类器来计算,以便根据所有数据的值有独特的值。基本上就像一个分类器学习算法,预测丢失的值(位于我的数据集的任何部分)。 有这样的东西吗?
浏览 1
提问于2019-02-13
得票数 0
回答已采纳
4
回答
关于数据科学中的“科学”的书?
statistics
、
reference-request
关于数据科学背后的科学和数学的书籍是什么?感觉上有那么多“数据科学”书籍是编程教程,不涉及数据生成过程和统计推断之类的东西。我已经可以编码了,我薄弱的是我正在做的事情背后的数学/统计/理论。 如果我准备在书上花1000美元(所以大约10本书.唉,我能买什么? 例如:分类数据分析,纵向数据的线性混合模型等.等等。
浏览 0
提问于2014-06-11
得票数 29
1
回答
黑匣子模型中分类特征的统计意义检验
machine-learning
、
xgboost
、
predictor-importance
假设我们有一个分类特性X_i,并且我们构建了一个类似于xgboost的黑匣子分类模型,X_i是众多预测器之一。我们想问一个问题:X_i对整个预测有影响吗?如果是的话,影响多少? 特别是,X_i可以是: 二分变量 N级变量,其中我们感兴趣的是两个特定级别之间的潜在差异。 在像线性回归这样的白盒模型中,我们通过检验来获得统计显着性.但是,我们能用黑匣子模型获得统计意义相似的结果吗?来自可解释的人工智能领域的任何工具都适用于此吗?还是只对输出概率进行标准t检验会更好呢?
浏览 0
提问于2020-02-06
得票数 1
2
回答
如何在Pandas中按顺序标注分类变量?
python
、
pandas
、
machine-learning
、
scikit-learn
、
data-cleaning
我有一个pandas数据框架,左边有以下分类变量作为列,右边有它们的具体实现, ? (为低分辨率道歉)。 对于统计回归,我想标记所有这些分类变量,例如,在LotShape中,Reg变成0,IR1变成1,IR2 2变成IR3 3。我发现scikit learn的LabelEncoder可以做job,但是有一个问题。这些分类变量中的一些是隐式有序的,0,1,...需要分配给正确的标签,而LotShape恰好是按顺序排列的。 所以我的问题是,我如何有效地,按照我指定的顺序,标记大量的分类变量?
浏览 28
提问于2019-01-10
得票数 2
回答已采纳
2
回答
机器学习分类器的主要假设(LG、SVM和决策树)
machine-learning
、
svm
、
decision-tree
、
logistic-regression
在经典统计中,人们通常陈述假定的假设(即数据的正态性和线性,数据的独立性)。但是当我阅读机器学习教科书和教程时,基本的假设并不总是明确或完整的表述。对于二进制分类,以下ML分类器的主要假设是什么,哪些假设不那么重要,哪些必须严格维护? Logistic回归 支持向量机(线性和非线性核) 决策树
浏览 5
提问于2016-02-16
得票数 7
1
回答
生成因子变量水平上的汇总统计数据(均值、std、min/max、# obs)
r
、
summary
如何计算连续变量在因子(分类)变量水平上的统计量(平均、最小/最大、#)? 例如,如果GPA是连续变量,而等级是第9、10、11和12级的范畴变量,那么有命令推荐吗?
浏览 10
提问于2022-11-21
得票数 0
1
回答
如何设计分类器接口、不同的分类器和数据存储?
c++
、
design-patterns
我有一门课: class TextClassifier { public: void init(const std::string& file); TextType classify(const std::string& text) const; private: HashMap<...> data_; } 函数init将一些统计数据从文件加载到分类中,HashMap函数进行朴素贝叶斯分类。 我认为做一个重构是一个好主意,这样这个类的用户就可以提供不同的分类器和不同类型的DataStorage。 但我有点卡住了,因为我不擅长设计。你能推荐一些好的设计
浏览 0
提问于2013-09-05
得票数 1
2
回答
同时显示帖子、类别、页面- wordpress
php
、
wordpress
、
custom-post-type
我正在收集统计数据,在那里我想要显示所有的页面,帖子,分类分类我有。 我可以显示帖子类型和页面,因为实际上它们都有一些帖子类型,但不能一起显示分类类别: <?php $excluded_ids = array(1, 5); $postArgs = array( 'post_type' => array('page', 'products'), 'order' => 'ASC', 'orderby' =>
浏览 0
提问于2016-11-07
得票数 0
3
回答
类似于节点类型的Drupal主题分类词汇
php
、
drupal-6
、
themes
、
taxonomy
可以像创建节点类型一样为Drupal6词汇创建主题吗?让它影响词汇表中的每个术语? 我发现当涉及到主题时,Drupal6的分类核心是缺乏的。我想要基于我的分类术语构建自定义图表和用户统计数据,但如果不使用视图进行一些丑陋的操作,我就无法接近它。 有什么想法吗? 谢谢! 亚瑟
浏览 0
提问于2010-06-20
得票数 0
回答已采纳
1
回答
如何理解卡方列联表
python
、
scipy
、
statistics
、
chi-squared
我几乎没有什么分类特征: ['Gender', 'Married', 'Dependents', 'Education', 'Self_Employed', 'Property_Area'] from scipy.stats import chi2_contingency chi2, p, dof, expected = chi2_contingency((pd.crosstab(df.Gender, df.Married).values)) print (f'Chi-squar
浏览 1
提问于2018-10-07
得票数 2
回答已采纳
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
分类资料的统计分析
统计学的研究对象与分类
分类统计函数Subtotal和Aggregate应用技巧解读!
SPSS统计分析基础版无序分类变量的统计推断——卡方检验
数据统计第一步:分类汇总
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券