腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
来自
不同
位置
的
数据
(
分类
变量
)
建立
统计
模型
?
modeling
我正在帮助我
的
女朋友为她
的
硕士论文项目做一个
模型
。Sci)。
数据
集具有以下列:站点距离(M)深度(cm) pH %N%C C:N 她测量了
来自
5个
不同
沼泽(湿地)
的
土壤/泥炭样本
的
pH、总碳和总氮。“distance (M)”是离非随机起点(湿区)
的
距离,在一些站点中,它也会倒退为负值。C:N由%N和%C派生而来,深度是采集土壤样本
的
深度。 我们应该
如何
对
数据
建模?我们怀
浏览 29
提问于2021-11-20
得票数 0
回答已采纳
1
回答
如何
开始分析和建模一个学术项目的
数据
,而不是
统计
学家或
数据
科学家
dataset
、
predictive-modeling
、
data-cleaning
、
linear-regression
我为一篇PhD论文收集了
数据
,需要帮助我理解
如何
构建一个路线图来进行分析和
统计
分析。PhD本身并不是在
统计
或机器学习,但我想了解
的
步骤和类型
的
分析,我必须遵循
的
数据
分析
的
高级学位?一般来说,我应该
如何
处理这个问题呢? 在我收集
的
数据
中,有623项观察,包括一个连续因
变量
和13个自
变量
(连续、
分类
和序数),它们是根据研究经验和文献
浏览 0
提问于2015-09-19
得票数 1
回答已采纳
3
回答
是否需要对此
数据
集进行热编码?
python
、
pandas
、
machine-learning
、
regression
、
one-hot-encoding
下面是
来自
UCI
数据
存储库
的
数据
集。我想要
建立
一个回归
模型
,将血小板计数作为因
变量
(Y),其余作为特性/输入。我
的
问题是: 在
建立
回归
模型
之前,应该对这些
变量
进行“一次热编码”吗?,我还观察到值在<
浏览 4
提问于2020-07-06
得票数 1
2
回答
当我们
使用
10倍交叉验证时,我们需要进行重要
的
测试吗?
machine-learning
、
cross-validation
通常是为了表明我们
的
结果不是偶然
的
,我们
使用
显着性检验,就像t-检验。但是当我们
使用
10倍交叉验证时,我们会在
数据
集块上学习和测试我们
的
模型
。我在想,当我们
使用
了10倍交叉验证时,是否需要进行t检验?更准确地说,我
的
意思是什么时候我们应该
使用
10倍交叉验证?
浏览 4
提问于2015-06-05
得票数 1
回答已采纳
1
回答
如何
度量ML任务中协
变量
的
信息?
machine-learning
、
information-theory
背景一个是贷款俱乐部贷款预测,另一个是在线实验领域
的
pravite
数据
集,用来预测客户是否会接受治疗。这两个任务都是具有100+Million观测和100个协
变量
的
二进制
分类
。然而,我
的
借贷俱乐部
模型
有一个很高
的
PR-ROC(0.86),这表明了
模型
的
良好性能。我用低
的
度量分数( proofs = 0.03)和高损失函数值作为证
浏览 0
提问于2019-12-21
得票数 1
2
回答
包装
的
情感分析工具(TextBlob/NLTK)和训练你自己
的
分类
器之间
的
区别?
machine-learning
、
nlp
、
sentiment-analysis
、
nltk
、
classifier
我在实践中对ML和训练
分类
器很陌生,所以我想知道NLTK和TextBlob等包
的
内置情感工具与手动创建
分类
器(培训、测试等)有什么
不同
。我想我在某个地方读到了这样
的
评论:Textblob/NLTK现有的情感分析工具基本上只是标记文本,并计算肯定/否定
的
单词数,以确定总体情绪评级(不确定这有多准确)。有没有人知道,一般来说,
使用
自定义
分类
器可以更好地对文本进行情感分析(我正在分析酒店评论中表达
的
情感)?
浏览 0
提问于2019-12-06
得票数 1
回答已采纳
2
回答
如何
在合适
的
glm
模型
中更改
变量
的
名称?
r
、
glm
我有一个
模型
对象
来自
一个
模型
(glm),它是由其他人在R. 在
模型
中有几个
变量
我想重新命名。我不容易访问重新运行他们
的
代码,并在他们
的
数据
框架中用
不同
的
变量
名构建
模型
。例如,他们将某个
变量
命名为"previous_customer“,并将其编码为一个虚拟
变量
。但是在我
使用
的
数据
框架中
浏览 0
提问于2018-06-07
得票数 3
回答已采纳
3
回答
传统预测分析与机器学习方法
machine-learning
、
deep-learning
、
predictive-modeling
、
statistics
使用
统计
及其工具进行
的
传统预测分析与
使用
机器学习和深度学习
的
传统预测分析有什么区别?我们
如何
利用机器学习和深入学习来更好地
建立
预测
模型
?
如何
确定何时
使用
传统
模型
的
边界,何时
使用
ML和DL?我们有很多有效
的
统计
工具可用Stata,SPSS。它们更容易
使用
。同时,计算效率也很高。我无法找到一些令人满意和令人
浏览 0
提问于2019-09-11
得票数 2
1
回答
R中
的
多水平Logistic回归
r
、
controls
、
logistic-regression
、
hierarchical
对于一艘实习船,我正在评估一项有利于环境
的
倡议,在那里,会员可以向他们
的
邻居做广告,说服他们也加入。我想从一组预测器中预测组成员(二进制): 这些
数据
被收集在,30个
不同
的
社区,,所以我
浏览 0
提问于2016-05-03
得票数 1
1
回答
如何
理解卡方列联表
python
、
scipy
、
statistics
、
chi-squared
我几乎没有什么
分类
特征: 'Married', 'Education', 'Property_Area']chi2} ,p-value: {p}')Chi-square Statistic : 79.63562874824729 ,p-value: 4.502328957824834e-19 我
如何
知道这些特性是否与这些
浏览 1
提问于2018-10-07
得票数 2
回答已采纳
1
回答
通过查看glm对R中
不同
数据
集
的
描述能力来评估glm
r
、
glm
我用glm
建立
了一个逻辑
模型
,其中包含了10个预测因子和一个二进制响应
变量
。该
模型
是
使用
我
的
整个
数据
集
的
子集(~8000观测)创建
的
,随机选择了3000个观测
数据
,将这些
数据
放入一个新
的
数据
集(新
数据
)中,并将glm与新
数据
进行拟合。为了评估
模型
,我想看看
模型
如何
很好地描述了
浏览 2
提问于2014-05-04
得票数 0
回答已采纳
1
回答
R线性回归与lm -
如何
处理有数千个值
的
分类
变量
(如城市或邮政编码)?
r
、
regression
利用R和线性回归函数lm()
建立
了零售商店销售预测
模型
。在我
的
数据
集中
的
许多相依特性
变量
中,有一些
分类
(因子)特性,可以接受数千个
不同
的
值(),例如邮政编码(和/或城市名称)。例如,仅加州就有6000多个
不同
的
邮政编码;如果我
使用
城市,就有400多个城市。 我理解lm()为
分类
特性
的
每个值创建一个
变量
。问题是,当我运行
浏览 0
提问于2016-03-17
得票数 1
1
回答
如何
将二进制KNN
分类
器转换为SVM
分类
器?
matlab
我正在
使用
KNN
分类
器对性别进行
分类
。我想添加一个SVM
分类
器,而不是具有相同标签0和1
的
KNN
分类
器(0用于女性,1用于男性)if class==1else
浏览 4
提问于2017-02-25
得票数 0
2
回答
为什么随机森林中
的
更多特征会显著降低准确率?
scikit-learn
、
random-forest
我
使用
sklearn
的
随机森林模块来预测基于50个
不同
维度
的
值。当我将维数增加到150时,
模型
的
精度会急剧下降。我希望更多
的
数据
只会使
模型
更准确,但更多
的
功能往往会使
模型
更不准确。我怀疑拆分可能只在一个维度上进行,这意味着在构建树时,实际上更重要
的
特征得到
的
关注较少。这可能是原因吗?
浏览 0
提问于2019-01-03
得票数 0
1
回答
机器学习有哪些算法?
机器学习
、
神经网络
、
深度学习
、
人工智能
、
编程算法
浏览 353
提问于2019-02-15
回答已采纳
4
回答
在交叉验证中,目标
变量
的
分布值可以用作特性吗?
accuracy
、
methods
我遇到了一个SVM预测
模型
,其中作者
使用
目标
变量
的
概率分布值作为特征集中
的
一个特征。例如:这合法吗?这听起来像是作弊。我认为在计算特性时,您必须将目标
变量
排除在测试集中,以避免“欺骗”
浏览 0
提问于2015-01-26
得票数 1
回答已采纳
1
回答
基于相似度
的
文本
分类
分析
python
、
logistic-regression
、
similarity
、
naive-bayes-classifier
、
text-classification
我已经阅读了大量关于文本
分类
和
不同
方法/
模型
的
文献,特别是
使用
Python语言,但我可能仍然缺少一些关于
如何
构建
模型
和所涉及
的
步骤
的
内容。 我有多个
数据
集,每个
数据
集都涉及特定
的
主题。这些
数据
集包括目前手动标记
的
新闻和假新闻。我已经收集了
不同
来源
的
类似主题
的
文本(
使用</em
浏览 0
提问于2020-05-11
得票数 0
2
回答
将SPSS
统计
数据
树
模型
导入SPSS建模器?
export
、
compatibility
、
spss
、
decision-tree
、
spss-modeler
我试图
使用
SPSS来测试在SPSS
统计
中
建立
的
决策树
模型
,但是我找不到任何简单
的
方法(只有xml导出,以后不能导入)。我还尝试
使用
相同
的
数据
集和设置(CHAID,父分支中
的
停止规则最小记录= 100,子分支中
的
50,等等)在Modeler中重新构建
模型
。但结果完全
不同
。我
使用
了3个输入
变量
,这些
变量
在SPSS<
浏览 4
提问于2016-01-03
得票数 1
回答已采纳
1
回答
这是改进
统计
模型
的
正确方法吗?
classification
我正在
建立
相当数量
的
统计
模型
-文本
分类
器和序列taggers。
统计
模型
在特征上是线性
的
- Logistic回归和线性链一阶CRF。 这些
模型
经历了几个阶段,从一个粗糙
的
初始版本一直到成熟
的
生产
模型
。给定一个规范和一些
数据
集(通常带有不完整
的
注释、噪声标签和特性),我从一个小
的
、手工标记
的
数据
集
浏览 0
提问于2015-10-30
得票数 1
1
回答
哪些类型对应于离散分布和连续分布?
r
我是R和一般编程
的
新手,我对
分类
变量
、连续
变量
和离散
变量
感到困惑。提前谢谢。
浏览 4
提问于2022-09-12
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
信用评分:第5部分-评分卡开发
数据挖掘系列(四)——挖掘建模(一)
流行于机器学习竞赛的Boosting,一文讲透足够了
流行于机器学习竞赛的Boosting,这篇文章讲的非常全了
BRAIN:机器学习:基于EEG的跨中心、跨方案的意识状态分类器
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券