开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark mllib: implicitTrain和explicitTrain之间的区别

Spark MLlib是Apache Spark的机器学习库，提供了丰富的机器学习算法和工具，用于构建和部署大规模的机器学习模型。在Spark MLlib中，implicitTrain和explicitTrain是两种不同的训练方法，它们之间的区别如下：

implicitTrain（隐式训练）：implicitTrain是一种基于隐式数据的训练方法。隐式数据通常是指用户对物品的行为数据，比如用户的点击、购买、评分等。在隐式训练中，模型会根据用户的行为数据来推断用户的偏好和兴趣，从而进行模型训练和预测。隐式训练适用于用户行为数据较为稀疏或者无法直接获得用户的显式反馈的场景。
explicitTrain（显式训练）：explicitTrain是一种基于显式反馈数据的训练方法。显式反馈数据通常是指用户对物品的明确评分或者喜好程度的数据。在显式训练中，模型会根据用户的明确反馈数据来进行模型训练和预测。显式训练适用于用户行为数据相对丰富且能够直接获得用户的显式反馈的场景。

这两种训练方法在使用上有一些差异和适用场景的区别。根据具体的业务需求和数据情况，选择合适的训练方法可以提高模型的准确性和性能。

腾讯云相关产品和产品介绍链接地址：

腾讯云机器学习平台（https://cloud.tencent.com/product/tiia）
腾讯云人工智能开发平台（https://cloud.tencent.com/product/ai）
腾讯云大数据与AI（https://cloud.tencent.com/solution/big-data-ai）

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

用Spark学习矩阵分解推荐算法

在矩阵分解在协同过滤推荐算法中的应用中，我们对矩阵分解在推荐算法中的应用原理做了总结，这里我们就从实践的角度来用Spark学习矩阵分解推荐算法。

03

白话推荐系统——从原理到实践，还有福利赠送！

之前流水账似的介绍过一篇机器学习入门的文章，大致介绍了如何学习以及机器学习的入门方法并提供了一些博主自己整理的比较有用的资源。这篇就尽量以白话解释并介绍机器学习在推荐系统中的实践以及遇到的问题... 也许很多点在行家的眼里都是小菜一碟，但是对于刚刚接触机器学习来说，还有很多未知等待挑战。所以读者可以把本篇当做是机器学习的玩具即可，如果文中有任何问题，还请不吝指教。本篇将会以下面的步骤描述机器学习是如何在实践中应用的： 1 什么是推荐系统？ 2 机器学习的作用 3 机器学习是如何使用的？ 4 基于S

06

你必须要了解的大数据潮流下的机器学习及应用场景

机器学习是一门人工智能的科学，能通过经验自动改进的计算机算法的研究。　　　机器学习是一个多学科交叉的领域，会涉及到计算机、信息学、数学、统计学、神经科学等。　　机器学习是大数据的核心技术

08

案例：Spark基于用户的协同过滤算法

一基于用户协同过滤简介基于用户的协同过滤算法(user-based collaboratIve filtering) 基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买，收藏，内容评论或分享)，并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行商品推荐。简单的说就是如果A,B两个用户都购买了x,y,z三本图书，并且给出了5星的好评。那么A和B就属于同一类用户。可以将A看过的图书w也推荐给用户B。 Spa

06

推荐系统遇上深度学习(三十)--深度矩阵分解模型理论及实践

本文提出了一种基于神经网络结构的矩阵分解模型。该模型综合考虑了用户对物品的显式评分和非偏好隐式反馈，然后通过两组神经网络将用户和物品的特征提取到一个低维空间；并通过设计的新的损失函数进行反向学习。本文设计的新损失函数将显式反馈加入二元交叉熵损失函数中，称为归一化交叉熵损失。实验证明该模型在几个典型数据集上相对于其他经典模型表现更好。

05

TalkingData大规模机器学习的应用

摘要：TalkingData目前提供应用统计分析、游戏运营分析、移动广告监测、移动数据DMP平台、移动行业数据分析等。随着各项业务快速发展，数据规模也越来越大，带来很大的挑战。本文将简要介绍我们应对这些挑战的一些经验。 TalkingData诞生于2011年，目前提供应用统计分析、游戏运营分析、移动广告监测、移动数据DMP平台、移动行业数据分析和洞察，以及企业级移动数据分析和挖掘的解决方案等产品和服务。随着各项业务快速发展，需要机器学习支撑的需求也越多越多，数据规模也越来越大，带来很大的挑战。而且Talki

04

深入理解Spark ML：基于ALS矩阵分解的协同过滤算法与源码分析

随着互联网的迅猛发展,为了满足人们在繁多的信息中获取自己需要内容的需求,个性化推荐应用而生。协同过滤推荐是其中运用最为成功的技术之一。其中,基于用户的最近邻法根据相似用户的评分来预测当前用户的评分。然而,在用户数量以及用户评分不足的情况下,该方法存在冷启动和数据稀疏的问题。为了解决这两个问题，业界提出了提出了基于项的最近邻法，利用项之间相似性稳定的特点可以离线计算相似性,降低了在线计算量,提高了推荐效率,但同样存在冷启动和数据稀疏问题。若使用矩阵分解中的奇异值分解 ( Singular Value Decomposition,SVD) 减少评分矩阵的维数,之后应用最近邻法预测评分,一定程度上解决了同义词问题,但由于评分矩阵中大部分的评分是分解之前填充的,所以得到的特征矩阵不能直接用于评分。业界还提出了一种基于矩阵分解和用户近邻模型的算法,解决了数据稀疏的问题,但存在模型过拟合的问题。而协同过滤提出了一种支持不完整评分矩阵的矩阵分解方法,不用对评分矩阵进行估值填充,有很好的推荐精度。在 Netflix推荐系统竞赛中的应用表明,该矩阵分解相对于其他的推荐算法能产生更精确的推荐。[1 2][1 2]^{[1~2]}

04

Collaborative Filtering(协同过滤)算法详解

基本思想基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买，收藏，内容评论或分享)，并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户

09

【陆勤学习】推荐系统开发的十个关键点

亚马逊的CEO Jeff Bezos曾经说过，他的梦想是“如果我有100万个用户，我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想，即通过数据挖掘技术，为每一个用户实现个性化的推荐结果，让每个用户更便捷的获取信息。为了实现这个梦想，智能推荐系统充分运用了机器学习、数据挖掘、搜索引擎、自然语言处理等相关领域的技术。从另一个角度来看，互联网信息的膨胀带来的信息过载（information overload），也同样呼唤智能推荐系统来帮我们去粗取精，挑选出最适合你的内容，这也是为什么很多推

深入机器学习系列之：ALS

ALS是交替最小二乘（alternating least squares）的简称。在机器学习中，ALS特指使用交替最小二乘求解的一个协同推荐算法。它通过观察到的所有用户给商品的打分，来推断每个用户的喜好并向用户推荐适合的商品。举个例子，我们看下面一个8*8的用户打分矩阵

02

个性化推荐系统中的绕不开的经典问题有哪些

推荐系统从诞生到现在，伴随产生了很多的问题，有一些问题有较好的解决方案，但是有的仍然没有通用的解决方案。介绍这些问题之前，先来介绍下推荐系统的预测手段。

03

矩阵分解之SVD和SVD++

上述两个问题，在矩阵分解中可以得到解决。原始的矩阵分解只适用于评分预测问题，这里所讨论的也只是针对于评分预测问题。

03

一位算法师工程师的Spark机器学习笔记：构建一个简单的推荐系统

推荐引擎应用场景： .用户有海量选择：随着场景内item越来越多，用户越来越难以选择到合适的产品 .个性化场景：在选择产品时，会借鉴那些与推荐用户相似地群体，利用群体智慧对用户进行推荐”千人千面” 在本篇博客中，会涉及到以下几个部分： .介绍不同类型的推荐引擎 .使用用户偏好模型来构造推荐模型 .使用训练好的模型来为指定user计算给定item的相似度大的items .使用标准的评测函数来构造推荐模型的好坏推荐模型类别： .基于item的过滤：使用item的内容或者属性，选择给定item的相似的item

07

深入机器学习系列10-ALS

交换最小二乘 📷 1 什么是ALSALS是交替最小二乘（alternating least squares）的简称。在机器学习中，ALS特指使用交替最小二乘求解的一个协同推荐算法。它通过观察到的所有用户给商品的打分，来推断每个用户的喜好并向用户推荐适合的商品。举个例子，我们看下面一个8*8的用户打分矩阵。 📷 这个矩阵的每一行代表一个用户（u1,u2,…,u8）、每一列代表一个商品（v1,v2,…,v8）、用户的打分为1-9分。这个矩阵只显示了观察到的打分，我们需要推测没有观察到的打分。比如（u6，v5）打

06

廖剑：机器学习平台对 AI 普适化的推动

12月15日，由腾讯云主办的首届“腾讯云+社区开发者大会”在北京举行。本届大会以“新趋势•新技术•新应用”为主题，汇聚了超40位技术专家，共同探索人工智能、大数据、物联网、小程序、运维开发等热门技术的最新发展成果，吸引超过1000名开发者的参与。以下是大数据AI分会场的演讲内容，稍作整理，分享给大家。

02

“轻易强快”的Spark on Angel，大数据处理爽到爆！

作者简介游遵文机器学习算法工程师，现任职于腾讯TEG数据平台部智能学习组，专注于机器学习算法的研究及其分布式实现，参与Angel开源项目开发及优化。 Spark的核心概念是RDD，而RDD的关键特性之一是其不可变性，来规避分布式环境下复杂的各种并行问题。这个抽象，在数据分析的领域是没有问题的，它能最大化的解决分布式问题，简化各种算子的复杂度，并提供高性能的分布式数据处理运算能力。然而在机器学习领域，RDD的弱点很快也暴露了。机器学习的核心是迭代和参数更新。RDD凭借着逻辑上不落地的内存计算特性，可以很

07

【Spark Mllib】性能评估 ——MSE/RMSE与MAPK/MAP

均方差（MSE），就是对各个实际存在评分的项，pow（预测评分-实际评分，2）的值进行累加，在除以项数。而均方根差（RMSE）就是MSE开根号。

03

干货 | 【深度学习】在【推荐算法】上的应用研究进展

关键字全网搜索最新排名【机器学习算法】：排名第一【机器学习】：排名第一【Python】：排名第三【算法】：排名第四文章来源：知乎作者：赵鑫深度学习将在多领域产生重要影响摘要：最近几年是深度学习发展的黄金时间，在多个领域取得了重要进展，包括图像领域、语音领域、文本领域等。深度学习为科研工作者提供了一种非常有效的技术途径，其本质上是对数据特征进行深层次的抽象挖掘，通过大规模数据来学习有效的特征表示以及复杂映射机制，从而建立起有效的数据模型。从方法上来说，深度学习具有的优点本质上是领域无关的。因

06

云+社区分享——腾讯云OCR文字识别

2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动，活动举办期间用户耐心听分享嘉宾的介绍，并提出了相关的问题，智能图像团队的科学家和工程师也耐心解答可用户的疑问。以下就是活动分享的全部内容。

个性化推荐系统那些绕不开的经典问题

在恰到好处的时候，用户邂逅到心仪的事物，想必正是一件美好之事。推荐系统就是那个促成美好的丘比特。

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭