首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >击打与标准化

击打与标准化
EN

Data Science用户
提问于 2016-07-22 00:36:21
回答 1查看 1.3K关注 0票数 1

我有一个不平衡的数据集X。我把它分为数据和标签,然后标准化数据。然后使用train_test_split对训练数据和测试数据进行分割,并输出结果。

现在,我想比较一下,如果我用smote来提升少数类的话,我会得到什么,但是我想保持比较的意义。为了做到这一点,我保留了和以前一样的测试数据,并且我只将新的合成样本添加到训练数据中。我该如何处理标准化工作?

我该不该

  1. 简单地假设,既然我使用了已经标准化的数据中的点,那么新的合成样本也会标准化吗?因此,只需将合成样本添加到列车数据中,就可以完成了吗?(不接触测试数据)
  2. 从预先标准化的数据中创建合成样本,标准化合成样本并将它们添加到列车数据中?(不接触测试数据)
  3. 从标准化前的数据中创建合成样本,将它们添加到列车数据中,并标准化整组数据?(不接触测试数据)
  4. 还是.?

我得到了非常不同的结果做这三种技术,什么是最好的方式得到一个有意义的结果和比较?

EN

回答 1

Data Science用户

回答已采纳

发布于 2016-07-31 23:48:47

解决方案1和3看起来非常相似,但是当我考虑编程范例时,我会选择1。

将分类看作是一条使用标准化、平衡和分类的大管道,人们不希望在平衡中重新标准化。此外,1中所作的假设是正确的。

以一种实用的方式,您可以使用不平衡API提供的管道来使用学习正规化器

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/12928

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档