在scikit-learn中创建交互术语

、

当然，在Python中创建交互术语的方法有很多，可以直接使用numpy或pandas，也可以使用像patsy这样的库。然而，我正在寻找一种创建交互术语scikit-learn风格的方法，即以一种与其fit-transform-predict范式完美结合的形式。我该怎么做呢？

浏览 11提问于2020-09-30得票数 0

回答已采纳

3回答

使用Scikit-learn计算信息增益

、、、、

我正在使用Scikit-learn进行文本分类。我想要计算每个属性相对于(稀疏)文档术语矩阵中的一个类的信息增益。但是我还没有在scikit-learn中找到这个方法。然而，上面的信息增益公式与互信息的度量是相同的，这是的。这也符合中的定义。是否可以在scikit-learn中使用特定的交互信息设置来完成此任务？

浏览 1提问于2017-10-15得票数 29

回答已采纳

1回答

变量的二次变换

、、

我试图学习一些机器学习，并想知道什么是二次和三次数据转换，它是如何完成的？上的一个人正在谈论这个问题，我想知道变量的转换是什么以及它是如何实现的。谢谢

浏览 3提问于2016-01-03得票数 5

回答已采纳

1回答

在python中创建交互术语

、、、、

我正在尝试在数据集中创建交互术语。有没有另一种(更简单的)方法来创建数据集中列的交互术语？例如，在列4:98和98:106的组合中创建交互术语。8): df[name] = var1_np[:,i]*var2_np[:,j] 其中，df是NumPy阵列中的数据帧

浏览 7提问于2021-06-06得票数 1

1回答

手动创建交互术语

我想在我的模型中包含一个交互术语： gen state_dom = 0 gen state_min = 0

浏览 28提问于2019-06-04得票数 0

2回答

使用Scikit-Learn CountVectorizer，根据文本语料库中的出现情况列出词汇表中的单词

、、、、

我在scikit-learn中的一些文档中安装了CountVectorizer。我希望在文本语料库中看到所有的术语及其相应的频率，以便选择停用词。

浏览 5提问于2013-04-18得票数 14

回答已采纳

1回答

用scikit计算原始形式的支持向量机常数b

、、、

我正在使用scikit-learn包在Python中实现它。在scikit-learn包中，w向量可以通过属性"coef_“找到，但是如何找到常数b的值呢？注意："intercept_“属性包含来自对偶形式的独立术语-P，而不是原始形式。

浏览 2提问于2014-02-25得票数 1

2回答

如何在Pandas中生成多个交互术语？

、、、

我想使用与年份、人口统计等许多交互作用来估计回归模型。我在Pandas中找不到一个明确的方法来做到这一点，我很好奇是否有人有提示。我正在考虑尝试scikit-learn和这个函数：

浏览 1提问于2015-10-21得票数 8

回答已采纳

2回答

意外地运行`pip3 install sklearn`破坏了我的scikit-learn安装

、、、

我试图更新scikit learn，不小心运行了pip3 install sklearn而不是pip3 install scikit-learn。已安装此程序...某物。我先试着运行pip3 uninstall sklearn，然后再试着运行pip3 install scikit-learn，但问题仍然存在。除了从头开始重新安装Python之外，有没有办法让我安装的scikit-learn再次工作？

浏览 38提问于2021-01-01得票数 0

2回答

R到SAS的交互作用

、、

我在模型中有如下交互术语：I((FAC == 'CE') * UR_log_lead6) 有人知道这种交互在SAS中是如何工作的吗？我理解R中的交互作用与SAS中的“交互”是不同的。*在SAS中，R中的":“和R中的"_”翻

浏览 2提问于2015-12-18得票数 0

2回答

如何在Scikit学习中实现TfidfVectorizer的手工工程特性？

、、

tfidf_vectorizer.fit_transform(documents) print(tfidf_matrix.shape)返回(567, 209)，这意味着有567个文档，每个文档都混合了由scikit-learn现在，我使用terms = tfidf_vectorizer.get_feature_names()获得了一个术语列表。，而不是手动选择的67个术语列表。如何使用67个手工选择的术语列表来运行tfidf_vectorizer.fit_transform(documents)函数？我在想，也许这需要我<

浏览 7提问于2017-12-21得票数 3

回答已采纳

1回答

文本聚类应用程序的含义

、、、、

在scikit-learn网站上有一个k-means应用于文本挖掘的例子。') print(' %s' % terms[ind], end='')(示例中的每个术语实际上是一个维度，因此每个术语的集群中心值是每个集群在术语维度中的“位置”。之所以对这些值进行排序，是因为每个术

浏览 1提问于2016-03-09得票数 1

2回答

循环通过变量创建交互术语

我寻求循环通过变量(可以包含在宏变量或数据集中)来创建具有交互条件的宏变量，我可以在回归中使用这些条件。下面是一个例子。我试图循环这些变量，并创建一个可用于回归的宏变量。在第一次迭代中，我们有年龄。

浏览 9提问于2016-02-05得票数 0

回答已采纳

3回答

谱聚类Scikit学习集群中的打印项

、、

我知道我可以使用以下代码获取K-means集群中特定集群的内容，并使用scikit-learn。我正在尝试在文本文档中对术语进行聚类。

浏览 4提问于2015-09-26得票数 3

回答已采纳

1回答

迷人5:你能在swf内调用嵌套的swf吗？

我正在使用迷彩5创建一个电子学习项目，由于吸引有限的动画能力，我创建了一个菜单栏在闪存和导入它作为一个swf。菜单栏有一个词汇表列表，当单击另一个swf时，它是术语表。问题是词汇表swf不会在“迷人”中单击术语表列表时弹出。菜单栏在“迷人”之外运行得很好。术语表已经用AS3制作了。所以我的问题是，，你能不能调用一个嵌套的swf？

浏览 1提问于2011-06-30得票数 0

回答已采纳

1回答

为什么md熵教程在scikit-learn/sklearn/cluster/k_means_.py中给出了错误？

、、、

当我在md熵包中做一个关于交互信息的教程时，我得到了以下错误： File "/home/midhun/scikit-learn/sklearn/cluster/k_means_.py", line 994

浏览 7提问于2018-10-16得票数 0

1回答

只计算单字表的tf-以色列国防军权重

、、

我想从文件中得到特定单词列表的tf-国防军权重。例如，我有如下感兴趣的词。''', '''document 2 blabla''']当然，我可以从文件中获得术语和权重但我只想从使用scikit-learn的文档组中获

浏览 0提问于2019-02-14得票数 0

回答已采纳

1回答

如何在logistic回归模型中添加交叉项？

我相信这些水果类型中的一些是相互依赖的，这意味着如果我在l1位置看到一个水果A，那么我很有可能在l1附近的位置观察到水果B。这意味着水果A和水果B共同栖息在邻近地区。我是否可以在logistic回归模型中添加交叉项来捕捉邻域特征？所以当我看到一个不同特征的新位置时，我的模型应该能够分辨出水果的类型？谢谢。

浏览 0提问于2021-03-30得票数 1

2回答

不能用pip更新到skear0.19吗？

、、、、

首先，我尝试使用以下命令根据更新包：或但是PyCharm的版本仍然是0.18。然后，我试图在"Settings--Project解释器“中运行更新，但失败了，出现了以下错误： InstallError:错误:一个或多个已经安装的包依赖于' conda‘，应该只在根环境中安装:conda

浏览 8提问于2017-09-13得票数 3

1回答

库伯内特斯:豆荚制造自动化

、、

在学习kubernetes时，经常会出现kubectl、主节点、api服务器等术语。Kubectl是与k8s集群交互的客户端，用于创建吊舱、管理它们等。例如，在本地，我使用它来处理minikube。但是kubectl更像是运行命令的手动交互。在生产环境中，豆荚应在需要时自动产卵。那这是怎么发生的？还是我对库贝特的理解错了？

浏览 2提问于2021-12-18得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Scikit-learn计算信息增益

变量的二次变换

在python中创建交互术语

手动创建交互术语

使用Scikit-Learn CountVectorizer，根据文本语料库中的出现情况列出词汇表中的单词

用scikit计算原始形式的支持向量机常数b

如何在Pandas中生成多个交互术语？

意外地运行`pip3 install sklearn`破坏了我的scikit-learn安装

R到SAS的交互作用

如何在Scikit学习中实现TfidfVectorizer的手工工程特性？

文本聚类应用程序的含义

循环通过变量创建交互术语

谱聚类Scikit学习集群中的打印项

迷人5:你能在swf内调用嵌套的swf吗？

为什么md熵教程在scikit-learn/sklearn/cluster/k_means_.py中给出了错误？

只计算单字表的tf-以色列国防军权重

如何在logistic回归模型中添加交叉项？

不能用pip更新到skear0.19吗？

库伯内特斯:豆荚制造自动化

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐