我有一个GBM模型,我想将其添加到Steam中的项目中,但是该模型没有显示在模型选项列表中。在我选择了我想要包含在项目中的数据框之后,"Select a Model Category List“没有包含任何类型的模型的选项(如果GBM是服务器上唯一的模型)。如果我在同一个数据框上创建一个GLM模型,那么“回归”会被列为一个选项,但只有GLM模型可供选择来创建项目;GBM仍然是隐藏的。我在文档中没有看到GBM不适用于Steam中的项目,但情况是这样的吗?是否存在GBM回归模型无法作为选项找到的错误?我可以通过R和Flow查看GBM模型,所以它肯定在服务器上。我运行的是h2o版本3.10.
我正在研究一个多类文本分类问题。我已经为同样的建立了梯度提升模型。
关于数据集的:
数据集有两列:"Test_name“和"Description”。
Test_Name列中有6个标签," description“列中有相应的描述。
My the the problem
数据准备
创建用于描述的单词向量。
使用单词向量构建一个语料库。
预处理任务,如删除数字,空格,停止词和转换为小写.
构建文档术语矩阵(dtm)。
从上面的dtm中删除稀疏的单词。
上述步骤导致一个计数频率矩阵,显示其编码应答列中每个字的频
我想从给定模型的可变重要性角度提取单个类别级别。在下面提供的数据集中有几个分类预测因子,但是当我计算特征重要性时,只显示了“整个列”的重要性,而不是将重要性分解为C1_level0: importance和C1_level1: importance。如果我手动对这些离散级别进行单热编码,我如何查看列的重要性?
>>> import h2o
>>> h2o.init()
Checking whether there is an H2O instance running at http://localhost:54321. connected.
--------