腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
实现
hivemall
回归
函数
的
问题
hadoop
、
hive
、
hiveql
您好,当尝试使用hive-malls
回归
工具包时,我在尝试构建特征表示时遇到错误。我一直在遵循这个指南https://
hivemall
.incubator.apache.org/userguide/supervised_learning/tutorial.html,并一直在尝试重现它我已经使用了提供
的
代码,但是在运行时遇到了
问题
。我
的
问题
似乎与指南
的
这一部分有关 create table if not exists pu
浏览 25
提问于2019-05-16
得票数 0
2
回答
蜂巢中
的
标记
函数
hive
、
tokenize
、
tf-idf
我有一张名为pigoutputhive
的
表,其中有以下字段:“body”列包含一个字符串,字词A& 0-9仅用空格分隔。我想标记这个主体,这样我就可以生成一个与owneruserid和body tuple
的
关系,以便执行TF-下手算法。create
浏览 2
提问于2016-03-27
得票数 0
回答已采纳
1
回答
有没有办法用
Hivemall
实现
线性
回归
?
hive
、
statistics
、
linear-regression
、
hiveql
、
bigdata
我对
Hivemall
了解不多。
浏览 0
提问于2016-02-02
得票数 1
1
回答
logistic
回归
的
成本
函数
实现
问题
python-3.x
、
logistic-regression
我试图运行一个逻辑
回归
的
成本
函数
,我一直收到这个
函数
是不正确
的
,我不知道为什么。
浏览 4
提问于2022-07-16
得票数 0
2
回答
在apache蜂巢中处理甲骨文
的
ROWID
oracle
、
hadoop
、
hive
、
hiveql
、
hortonworks-data-platform
我正在将oracle查询转换为hiveql;如何使用oracle中
的
ROWID将查询转换为hive。
浏览 1
提问于2015-05-24
得票数 0
回答已采纳
2
回答
Logistic
回归
的
Python
实现
作为
回归
(不是分类!)
python
、
logistic-regression
我有一个
回归
问题
,我想使用logistic
回归
而不是逻辑分类,因为我
的
目标变量y是0到1之间
的
连续变量。然而,在Python中,logistic
回归
的
常见
实现
似乎完全是逻辑分类。我还看过GLM
实现
,似乎没有一个
实现
过sigmoid链接
函数
。有人能指点我将Python
实现
的
逻辑
回归
作为
回归
算法
的
方向吗?
浏览 4
提问于2020-12-12
得票数 1
回答已采纳
1
回答
按键显示不同值
的
星火/蜂巢
apache-spark
、
hive
、
apache-spark-sql
、
aggregate-functions
、
hiveql
在大数据处理中,通常希望在不改变现有查询结构(分组、子查询等)
的
情况下“勾勒”组摘要。在Spark (和HiveQL)中,collect_set就是这样做
的
一个例子。它构建每个组列
的
唯一值
的
数组。我正在寻找一个联非新议程,它为B列
的
每个唯一值从A列构建一个唯一值
的
映射。by datedate distinct_user_ids_by_category1/2 {a: [3], b: [2, 4]} 要求相同
浏览 12
提问于2016-12-30
得票数 0
回答已采纳
2
回答
开始在java中编写Logistic
回归
machine-learning
、
logistic-regression
我想用java编写逻辑
回归
(分类
问题
)算法- 有没有人能告诉我− 我可以编写线性
回归
的
代码它
的
假设是 这是相对容易
的
,但不能从逻辑
回归
开始。
浏览 1
提问于2014-01-13
得票数 0
3
回答
不平衡训练数据集与
回归
模型
r
、
machine-learning
、
regression
、
random-forest
我有一个大型数据集(>300,000次观测),它代表蛋白质之间
的
距离(RMSD)。我正在建立一个
回归
模型(随机森林),用来预测两种蛋白质之间
的
距离。我
的
问题
是,我对近距离匹配(短距离)更感兴趣,但是我
的
数据分布有很大
的
偏倚,所以大部分距离都很大。我并不在乎模型能预测多远
的
距离,所以我想确保模型能够准确地预测接近模型
的
距离。然而,当我对模型进行完整数据
的
训练时,模型
的
性能并不好,所以我想知道我能
浏览 1
提问于2014-03-28
得票数 2
回答已采纳
1
回答
人工神经网络激活
函数
与梯度
machine-learning
、
neural-network
、
backpropagation
、
transfer-function
、
activation-function
我有个
问题
。我看了一个关于在C++中
实现
人工神经网络
的
非常详细
的
教程。现在,我对神经网络是如何工作
的
,以及如何进行编程和训练,有了更多
的
基本理解。因此,在本教程中,双曲正切用于计算输出,显然它
的
导数用于计算梯度。然而,我想转到另一个不同
的
功能。特别是漏(以避免死亡神经元)。 我
的
问题
是,它指定这个激活
函数
应该仅用于隐藏层。对于输出层,应该使用不同
的
函数
( soft
浏览 1
提问于2017-10-07
得票数 1
回答已采纳
2
回答
如何使用Weka中
的
新培训数据更新经过培训
的
模型(weka.classifiers.functions.MultilayerPerceptron)?
machine-learning
、
neural-network
、
data-mining
、
weka
、
regression
我想加载一个我以前训练过
的
模型,然后用新
的
训练数据更新这个模型。但我发现这个任务很难完成。我从那里学到
实现
weka.classifiers.UpdateableClassifier接口
的
分类器可以递增地接受训练。然而,我训练
的
回归
模型使用
的
是weka.classifiers.functions.MultilayerPerceptron分类器,它没有
实现
UpdateableClassifier。然后我检查了Weka API,结果发现没有
回归<
浏览 3
提问于2013-11-22
得票数 1
1
回答
正则化
的
概率建模(logistic?)python
回归
模型
scikit-learn
、
regression
、
linear-regression
、
logistic-regression
、
statsmodels
我想用
回归
模型来拟合概率。我知道线性
回归
经常用于这个目的,但我有几个概率在0.0和1.0左右,并且想要拟合一个
回归
模型,其中输出被限制在0.0到1.0之间。我希望能够为模型指定正则化规范和强度,最好在python中这样做(但R
实现
也会有帮助)。我发现
的
所有逻辑
回归
包似乎只适合于分类,而这是一个
回归
问题
(尽管我想使用logit链接
函数
)。我使用scikits为我
的
分类和
回归
需求学习,所以如果这个<em
浏览 4
提问于2015-11-21
得票数 3
1
回答
Hive中有Bloom Filter UDF
函数
吗?
hive
、
user-defined-functions
、
bloom-filter
在大型事实表连接增量事实表
的
问题
上,我知道Bloom Filter是减少No
的
很好选择。brickhouse
的
Bloom UDF很少,但是很少有Bloom UDF
实现
,只有我能找到
的
是brickhouse
的
bloom UDF,而且使用起来不是很充分,你需要先读取小表并将bloom数据加载到本地目录中那么,有没有更好
的
Bloom Filter UDF
实现
,我可以直接在Hive中使用(只需上传JAR)?谢谢。
浏览 7
提问于2021-05-31
得票数 0
2
回答
logistic
回归
和线性
回归
有什么区别?
machine-learning
、
neural-network
、
linear-regression
、
logistic-regression
、
loss-function
我知道线性
回归
做“
回归
”,logistic
回归
做“分类”。当我们
实现
这两种方法时,我能注意到
的
唯一不同是损失
函数
:线性
回归
使用均方误差这样
的
损失
函数
,logistic使用交叉熵。还有什么我不知道
的
区别吗?
浏览 0
提问于2018-09-14
得票数 1
回答已采纳
1
回答
浅层神经网络用于预测除1或0以外
的
其他数?
neural-network
、
prediction
因此,在我
的
学习努力中,我偶然发现了Siraj Ravel
的
youtube频道,还有他
的
Github,他在那里发布了一个神经元神经网络,预测给定输入
的
输出。*我看了它和他附带
的
视频,得到了它如何工作
的
基本要点。在运行了几次之后,我做了一些小
的
调整,比如输入,我决定为什么不尝试添加除1和0以外
的
数字。我创建了一个模式,输出是添加
的
输入,但是,我遇到了一个错误,它
的
测试输出是‘1’。我认为这是因为乙状结肠
函数</
浏览 0
提问于2017-07-27
得票数 0
回答已采纳
1
回答
线性
回归
实现
中
的
问题
python
、
numpy
、
machine-learning
、
linear-regression
我是机器学习
的
新手,我正在尝试使用numpy从头开始
实现
矢量化线性
回归
。我试着用y=x测试这个
实现
,但是我
的
损失越来越大,我也不明白为什么。如果有人能指出为什么会发生这种情况,那就太好了。提前感谢!
浏览 16
提问于2020-02-09
得票数 3
回答已采纳
1
回答
用于线性
回归
的
神经网络
c
、
machine-learning
、
neural-network
、
regression
、
gradient
我找到了一个非常棒
的
源代码,它完全符合我所需要
的
模型:你有一个x->y图,每个x值都是“特征”
的
总和,或者我将如何表示它们,z。因此x->y图
的
回归
线应该是
函数
,其中h(x)是
回归
线( h(SUM(z(subscript-i)) ) 在这种神经网络中,其思想是以最小化最小平方误差
的
方式为每个z-value分配一个权重。梯度
函数
用于更新权重以最小化误差。我相信我可能
浏览 1
提问于2016-02-03
得票数 0
3
回答
使用自定义目标/损失
函数
的
随机森林
回归
器(Python/ Sklearn)
python-3.x
、
scikit-learn
、
random-forest
、
statsmodels
、
poisson
我想建立一个随机森林
回归
模型来模拟计数数据(泊松分布)。默认
的
'mse‘损失
函数
不适用于此
问题
。有没有一种方法可以定义自定义损失
函数
并将其传递给Python中
的
随机森林
回归
器(Sklearn等)?有没有什么
实现
可以将Python中
的
计数数据放入任何包中?
浏览 4
提问于2018-03-26
得票数 7
1
回答
梯度提升树
的
弱学习分类/多类分类
machine-learning
、
scikit-learn
、
classification
我是机器学习领域
的
初学者,我想学习如何使用梯度增强树(GBT)进行多类分类。我读过一些关于GBT
的
文章,但是关于
回归
问题
,我找不到关于GBT多类分类
的
正确解释。GBT
的
实现
是利用
回归
树作为弱学习者进行多类分类
的
GradientBoostingClassifier。 GB以提前阶段
的
方式建立了一个加性模型;它允许对任意可微损失
函数
进行优化。在每个阶段,n_classes_
回归
树都适
浏览 0
提问于2018-04-25
得票数 0
回答已采纳
1
回答
SGD分类器和Logisitc
回归
有什么区别?
machine-learning
、
logistic-regression
、
gradient-descent
、
loss-function
据我理解,SGD分类器和Logistic
回归
似乎相似。损失=对数
的
SGD分类器
实现
Logistic
回归
,损失=铰链
实现
线性支持向量机。我还了解到logistic
回归
采用梯度下降作为优化
函数
,SGD采用随机梯度下降,收敛速度要快得多。但这两种算法中哪一种会在哪种情况下使用?另外,SGD和Logistic
回归
有什么相似之处,它们又有何不同?
浏览 0
提问于2018-09-07
得票数 10
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券