腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
pandas
不
显示
结果
来
训练
先验
数据
集
、
但是
结果
没有出来,也没有
显示
任何错误。
浏览 15
提问于2019-12-31
得票数 1
1
回答
如何根据几个模板对句子进行分类?
、
、
、
对于特征提取部分,我尝试了人们通常
使用
的大多数特征,如n-gram,向量表示,弓等。在这种情况下,当每个类只有几个模板时,最好的算法是什么? 感谢Amir :)
浏览 0
提问于2016-12-19
得票数 0
2
回答
什么时候用Bayes定理
来
模拟一个问题?
、
我有一个有标签的
训练
数据
集
,其中每个观察都有一个句子,无论是英语还是法语,作为它的预测,它的标签(目标值)是英语还是法语。测试
集
再次包括一些句子,无论是英语还是法语,但没有标签。我的一位朋友建议,我们应该
使用
Bayes定理
来
建模这个问题,因为我们有一些
先验
值(在
训练
集中有标记的观察)。我同意这也是可行的,但我不能真正理解他的论点:“我们应该用Bayes定理
来
建模这个问题,因为我们有一些
先验
值”。这是因为在我看来,每一
浏览 0
提问于2018-07-13
得票数 2
2
回答
不
超过(/under)采样不平衡的
数据
集会引起问题吗?
、
、
我阅读了很多关于如何专门为不平衡的
数据
集
使用
不同的度量(例如,存在两个类,但80%的
数据
是一个类),以及如何处理不平衡
数据
集
的问题。一个技巧是过采样,因此获取更多(甚至重复一些)属于未充分表示的类的
数据
。我尝试过这一点,并取得了更好的
结果
(在我的模型能够很容易地预测每件事情的单个类,达到80%的准确性lol之前)。然而,我在想,这个模型与现实生活中的
数据
相吻合吗?
数据
科学/机器学习的“规律”之一是,您的培训
浏览 0
提问于2021-04-29
得票数 5
回答已采纳
2
回答
不平衡
数据
集
的定义是什么?
、
我有数千个
数据
源,从类似类型的硬件中生成
数据
。然而,不同的来源在
数据
集中产生了不同的动态!不同
数据
源上的类数不同,因此需要建立不同的模型。这意味着,在最后,我有许多不同的模型要评估。由于这是一个多类分类问题,所以
使用
了混淆矩阵和多条ROC曲线。 现在,我正试图在更多的细节中,看看在最糟糕的模型中,是什么导致了糟糕的表现。通常的
浏览 0
提问于2019-12-09
得票数 3
1
回答
多层感知器代码解释
、
、
、
解决方案:traincol1 = linspace(0.1, 15, 40)';traincol2 = sin(traincol1traincol1 - eps;save('snn_a.txt','train');生成测试
集
testcol1 - ep
浏览 6
提问于2016-12-14
得票数 0
回答已采纳
1
回答
使用
sk-learn进行分类:在预测时处理丢失的分类特征
、
、
我的项目我
训练
了一个BaggingClassifier。由于
使用
的
数据
包含分类特征,因此我
使用
pandas
框架(Get_dummies)对其进行编码。在此之后,我
训练
分类器。预测
数据
集
内的给定特征:6 由于编码,在这种情况下,
训练
数据
集
扩展到12个特征。我用于预测的编码
数据
只有6个特征,因为它只有一行
数据
,在编码过程
浏览 6
提问于2015-05-06
得票数 3
1
回答
Apache open NLP POS标记错误
、
、
、
我
使用
过Stanford NLP,但由于他们更严格的许可条款(虽然它被声明为GPL,但它只能用于非营利性项目),我正在评估Apache Open NLP。
浏览 6
提问于2016-11-06
得票数 1
2
回答
Weka中的
训练
集
精度
我在Weka中运行一些简单的分类器
来
测试水域,但我找不到这段特定的输出
数据
。 当
使用
像% split这样的东西时,我如何获得
训练
集
的准确性,而不仅仅是测试
集
的准确性?
浏览 1
提问于2013-02-06
得票数 0
回答已采纳
1
回答
机器学习中
数据
集
的标注
、
、
我观察到的例子是简要概述了.For
训练
系统,给出了特征向量作为输入。在有监督学习的情况下,
数据
集
被标记。我对贴标签感到困惑。例如,如果我必须区分两种类型的图片,我将提供一个特征向量,并在输出端测试,我将提供1类型A和2类型B,但如果我想从图像
数据
集中提取感兴趣的区域。我将如何标记我的
数据
来
提取ROI
使用
支持向量机。
浏览 1
提问于2016-02-14
得票数 2
2
回答
Scikit-学习
数据
索引和引用
、
我
使用
GridsearchCV
训练
了多个不同的模型。在
训练
过程中,
数据
排序如下: [feature 1, feature 2, feature 3, feature 4] 我想
使用
保存的(用joblib保存的)模型
来
预测新
数据
。新
数据
/不可见
数据
的顺序如下: [feature 1, feature 2, feature 4, feature 3]
训练
数据
和新
数据
之间的特
浏览 16
提问于2019-02-26
得票数 0
2
回答
如何平衡某个类的样本数量非常多的
训练
数据
集
?
、
、
、
、
我一直在
使用
烂番茄电影评论
数据
集
进行情绪分析预测。
数据
集
具有5个类别{0,1,2,3,4},其中0是非常负的,而4是非常正的。
数据
集
是高度不平衡的,'0': 7072 (4.5%), '1': 27273 (17.4%), '2': 79583 (50.9%), '3': 32927(21%), '4': 9206 (5
浏览 5
提问于2014-11-19
得票数 1
4
回答
在
训练
集
上评估一个模型是一个好的实践吗?
、
、
、
、
对
训练
集
模型进行评价(即
训练
训练
模型,在同一
训练
集
上评估回归误差/精度),并将评价
结果
与模型回归误差/交叉验证(我们在同一
训练
集
上进行交叉验证)和测试
集
的精度进行比较,以检查过拟合/
不
拟合是否是一种很好的做法吗据我所知,我们不应该对
训练
集
的模型进行评估。然而,我看到一些讲座似乎促进了对
训练
错误的评估。
浏览 0
提问于2020-08-20
得票数 1
2
回答
训练
集
和测试
集
大小
、
、
如何正确处理培训/测试
集
的生成?我正在做几个实验
来
测试我的神经网络模型的泛化能力,所以在所有实验中,我的测试
集
都不同于我的
训练
集
(例如,在一个实验中,
训练
集
和测试
集
之间的句子结构是相同的,而在
训练
集中我
使用
一组单词,在测试集中
使用
另一组单词因此,我的问题是:为了能够比较实验之间的准确性,我是否必须在实验之间保持相似的
训练
集
/测试
集</e
浏览 0
提问于2021-07-08
得票数 1
1
回答
学习、验证和测试分类器
、
我有210个
训练
数据
,我
使用
朴素贝叶斯作为分类器。我正在实现
使用
PHP和MySQL作为我的
数据
库
来
训练
数据
。我所做的是按顺序进行的: 我将
训练
数据
插入到
数据
库中,这样我的分类器就可以根据
训练
数据
进
浏览 9
提问于2013-07-05
得票数 0
回答已采纳
1
回答
Pandas
dataframe -将N行从一个
数据
帧移动到另一个
数据
帧
、
、
我有一个用于机器学习的
训练
集
和测试
集
,但是
训练
集
包含的
数据
行太多,而测试
集
包含的
数据
太少。我计算出我需要将245行从
训练
集中移动到测试集中,以产生更好的拆分。我该怎么做呢?首先,我
使用
下面的代码随机化
训练
集
的行 train_df = train_df.sample(n = len(train_df)).reset_index(drop=True) 然后,我想获取最后245行,并将它
浏览 13
提问于2020-12-24
得票数 0
回答已采纳
1
回答
如何在tensorflow中验证神经网络?
、
、
、
、
目前,我的神经网络只
使用
训练
数据
集
进行
训练
,但我也想验证,但我不知道如何准确地做到这一点。我应该在每个时期之后对整个验证集运行测试吗?如果是,那么从测试中,我会得到一个准确性,但我也不知道该怎么做?在这种情况下,验证
集
的
结果
对它有何影响?project/model/model.ckpt") return
浏览 0
提问于2018-03-16
得票数 0
1
回答
测试网络而
不
设置迭代次数
、
我有一个预先
训练
过的网络,我想用它
来
测试我的
数据
。我
使用
.prototxt定义了网络体系结构,我的
数据
层是一个自定义的Python层,它接收带有
数据
路径及其标签的.txt文件,对其进行预处理,然后提供给网络。在搜索用于测试网络的命令时,如果我
不
设置-iterations,它将
使用</e
浏览 2
提问于2016-09-21
得票数 0
回答已采纳
1
回答
如何
使用
只有一个标签的
数据
来
训练
模型
、
、
我正试图建立一个模型
来
预测一场网球比赛的
结果
(胜负),作为一项练习。我正在
使用
Python,
Pandas
和scikit-学习。 尝试
使用
单值
训练
器(例如1标签支持向量机)
来<
浏览 0
提问于2019-06-07
得票数 0
1
回答
Tensorflow:创建用于机器翻译的自定义文本
数据
集
、
、
、
我希望
使用
自己的
数据
为
训练
模型。在TFDS中已经有一组
数据
集
可用(Tensorflow
数据
集
),还可以选择到TFDS。但是,如果我不必等待这些添加请求和内容,并直接
训练
我的
数据
,那会怎么样呢?在示例colab笔记本中,他们
使用
以下内容
来
创建
训练
和验证
数据
: examples, metadata = tfds.load('ted_hrlr_translat
浏览 16
提问于2019-07-19
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券