首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用户画像--《机器学习实践》笔记

最近学习了用户画像方面的内容,本文主要是学习机器学习实践》的读书笔记。什么是用户画像?用户模型和用户画像的区别。...用户画像数据挖掘画像数据挖掘架构用户画像标签体系,从开发实现,通常分为两大类:经过策略统计分析(通过统计);经过机器学习模型预测。...机器学习模型有特征库后,就需要对标签做机器学习建模。需要用算法完成:特征选择,模型训练,效果评估,预测。模型训练常用工具:spark MLib,sklearn,XGBoost,Tensorflow等。...以推荐业务为例:推荐业务根据每个用户的画像进行个性化推荐,展示改用户可能感兴趣的购单或者店铺。...以推送业务为例:推送业务从海量用户中筛选出目标用户人群 ,向他们发送优惠券或者促销通知。这其中重要环节就是通过画像搜索人群。

3.7K183
您找到你想要的搜索结果了吗?
是的
没有找到

技术解析】机器学习配送系统的实践:用技术还原真实世界

技术解析 ? × 全文共计6532字 预计阅读时间17分钟 简介:何仁清,配送AI方向负责人。...本文重点解读在即时配送领域机器学习技术的最新进展,构建对线下真实世界各种场景的感知能力,还原并预测配送过程各个细节。...为了满足这些要求,我们建设了“超脑”配送系统,包含以下几个方面: 大数据处理和计算能力 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。...机器学习技术挑战 如何构建一个在真实物理世界运行的AI系统,就是我们最大的挑战。...通过机器学习方法,我们已经将外卖配送几乎所有环节都进行了精准预估预测。

86850

推荐算法实践:机器学习重排序模型

本文介绍了网推荐系统的构建和优化过程中的一些做法,包括数据层、触发层、融合过滤层和排序层五个层次,采用了HBase、Hive、storm、Spark和机器学习等技术。...团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由技术团队成员撰写,介绍其推荐系统的构建和优化过程中的一些做法。 框架 ?...排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...用户主动行为数据记录了用户在平台上不同的环节的各种行为,这些行为一方面用于候选集触发算法(在下一部分介绍)中的离线计算(主要是浏览、下单),另外一方面,这些行为代表的意图的强弱不同,因此在训练重排序模型时可以针对不同的行为设定不同的回归目标值...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法

2K60

,正在改造

正在告别,将目光投向了全新的发展战局之中。对于来讲,这是一个新的开始,这同样是一次顺势而为。因为只有这样,才会和那些曾经和它一起成长起来的玩家们一道共赴一个全新的发展新纪元。...一 以往我们所认识的,更多地是和外卖一词联系在一起的,提及,在很多情况下,便会提及「外卖」的字眼。这是由本身的发展历程所决定的。...以往,提及,我们看到的更多的是,它在流量的获取上,规模的做大上所做的诸多动作,比如,与大众点评的合并;比如,收购摩拜单车等,都是这一现象的直接体现;现在,提及,沃恩看到的更多的是,它在科技研发上的投入...从今年以来的表现来看,我们同样可以非常明显地感受到,与科技之间的连接同样是越来越强了,科技给带来的改变越来越多了,科技让开始有了更多的想象空间。...结语 透过的财报,我们可以非常明显地感受到,在这条路上走得愈发坚定。这样一条路,便是开始告别以往的自己,投身到新科技的星辰大海之中。

39020

机器学习实践》第二章 特征工程

数据和特征决定了机器学习的上限,而模型和算法只是无限逼近这个上限而已。 基于大量数据的简单模型胜于基于少量数据的复杂模型;更多的数据胜于聪明的算法,而好的数据胜于多的数据。...概念 从数学角度讲,特征工程就是将原始数据空间变换到新的特征空间,或者说是换一种数据的表达方式,在新的特征空间中,模型能够更好地学习数据的规律。...+r_{f_kf_1}})} \Big] 其中, 封装方法 由于过滤方法与具体的机器学习算法相互独立,因此过滤方法没有考虑选择的特征集合在具体机器学习算法上的效果。...与过滤方法不同,封装方法直接使用机器学习算法评估特征子集的效果,它可以检测出两个或者多个特征之间的交互关系,而且选择的特征子集让模型的效果达到最优。...嵌入方法 将特征选择嵌入到模型的构建过程中,具有封装方法与机器学习算法相结合的优点,而且具有过滤方法计算效率高的优点,嵌入方法是实际应用中最常见的方法,弥补了前面两种方法的不足。

45330

实例详解机器学习如何解决问题

不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。...我们结合机器学习上的实践,介绍机器学习在解决工业界问题的实战中所需的基本技术、经验和技巧。...下文分为1)机器学习的概述,2)对问题建模,3)准备训练数据,4)抽取特征,5)训练模型,6)优化模型,7)总结 共7个章节进行介绍。 机器学习的概述: 什么是机器学习?...为什么要用机器学习解决问题?...对问题建模 本文以DEAL(购单)交易额预估问题为例(就是预估一个给定DEAL一段时间内卖了多少钱),介绍使用机器学习如何解决问题。

1.1K90

【揭秘】如何用机器学习优化推荐系统算法

本文介绍了网推荐系统的构建和优化过程中的一些做法,包括数据层、触发层、融合过滤层和排序层五个层次,采用了HBase、Hive、storm、Spark和机器学习等技术。...团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由技术团队成员撰写,介绍其推荐系统的构建和优化过程中的一些做法。 1、框架 ?...排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...1、用户主动行为数据记录了用户在平台上不同的环节的各种行为,这些行为一方面用于候选集触发算法(在下一部分介绍)中的离线计算(主要是浏览、下单),另外一方面,这些行为代表的意图的强弱不同,因此在训练重排序模型时可以针对不同的行为设定不同的回归目标值...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法

1.1K60

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

71520

机器学习 如何解决问题?以为例

不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。...我们结合机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器学习InAction系列”标签的文章),介绍机器学习在解决工业界问题的实战中所需的基本技术、经验和技巧。...下文分为1)机器学习的概述,2)对问题建模,3)准备训练数据,4)抽取特征,5)训练模型,6)优化模型,7)总结 共7个章节进行介绍。 ---- 机器学习的概述: 什么是机器学习?...为什么要用机器学习解决问题?...---- 对问题建模 本文以DEAL(购单)交易额预估问题为例(就是预估一个给定DEAL一段时间内卖了多少钱),介绍使用机器学习如何解决问题。

78050

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

69130

图灵机器学习平台性能起飞的秘密(一)

总第543篇 2022年 第060篇 图灵机器学习平台在长期的优化实践中,积累了一系列独特的优化方法。...总结 导语 图灵平台是履约平台技术部2018年开始自研的算法平台,提供模型全生命周期的一站式服务,旨在帮助算法同学脱离繁琐的工程化开发,把有限的精力聚焦于业务和算法的迭代优化中。...随着图灵机器学习平台的发展,图灵技术团队在内存优化、计算优化、磁盘IO优化三个方面沉淀了一系列性能优化技术。我们将以连载的方式为大家揭秘这些技术。...业务背景 图灵平台主要包括机器学习平台、特征平台、图灵在线服务(Online Serving)、AB实验平台四大功能,具体可参考《一站式机器学习平台建设实践》以及《算法平台在线服务体系的演进与实践》这两篇博客...作者简介 琦帆、立煌、兆军等,均来自到家事业群/履约平台技术部。 ---------- END ----------

47610

搜索广告排序推荐,从机器学习到深度学习的模型实践

同时各种开源深度学习框架层出不穷,集团数据平台中心也迅速地搭建了GPU计算平台,提供GPU集群,支持TensorFlow、MXNet、Caffe等框架,提供数据预处理、模型训练、离线预测、模型部署等功能...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...结合多品类的业务特点及O2O模式独特的需求,着重介绍几个业务场景以及如何刻画: 用户的消费场景 “附近”请求:和大众点评App中,大部分用户发起请求为“附近”请求,即寻找附近的美食、酒店、休闲娱乐场所等...但是在等电商的业务场景下,输入的数据形态非常丰富,有很多业务数据有明确的物理含义,因此一部分人工特征工程也是必要的,提前对信息做一个合理的抽取表示,再通过神经网络学习进行更好的信息融合和表达。...在搜索广告的场景下,用户的实时行为有非常强的指代性,但是以原始形态直接送入神经网络,会损失掉很多信息,因此我们对它进行了不同方式描述和表示,再送入神经网络之中进行信息融合和学习

2.4K10

O2O广告营销中的机器学习技术

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助数亿消费者和数百万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待,本文选自书中第十一章。...如何帮助本地商户开展在线营销,使得他们能快速有效地触达目标用户群体提升经营效率,是的核心问题之一,而机器学习相关技术在本地在线营销场景下发挥着非常关键作用。 本文将从5个方面来介绍。...广告点击率预估问题是一个典型的监督机器学习问题,它的目标是在给定广告商户、用户和查询上下文的前提下准确预测点击行为发生的概率。...O2O广告是的核心问题之一。本章着重介绍了如何应用机器学习方法提升广告投放的效果和效率,以及本地场景化的推送广告。此外,还简要展示了O2O广告平台相关的工具。 参考文献 [1] Huang, P.

1.3K50

自主研发、不断总结经验,搜索推荐机器学习平台

内容来源:2018 年 5 月 26 日,点评技术专家杨一帆在“饿了么技术沙龙·第25弹【搜索推荐】”进行《Why WAI: 点评搜索推荐机器学习平台》演讲分享。...What 什么是机器学习 机器学习本质上是计算机模拟人类学习行为从数据中提取发现知识结构获取新的知识和技能,并通过迭代的方式改善自身性能。...机器学习有几个比较典型的类别,面临一个问题的时候可以根据该问题特性、样本属性或样本量等来决定其归属于哪类机器学习范畴以及对应模型。...点评的机器学习应用大部分还是围绕业务来开展,包括搜索推荐、金融、外卖、打车、广告等。 机器学习通用流程 机器学习整个流程包含几个部分。...机器学习痛点 以下是我们在平时的机器学习实践中总结的一些痛点。 业务应用门槛高,普通的业务很难搭建起整套系统。 训练流程维护困难。

2.6K51

围魏救赵

近日,有报道称APP正在内测短视频功能,并且还测试了编辑工具“皮皮虾”。此次测试可以看做是进军短视频领域的重要信号,而的入局或将在短视频领域掀起新波澜。...短视频“真香” 正如在广告片中的广告词“,美好生活小帮手”所言,对自身的准确定位在于生活服务。...用户增长对的重要性不言而喻,随着短视频用户群体的不断扩大,上线短视频功能的自然也能获得新流量。 另一方面,获取新的用户之后,的短视频功能也能提高其用户黏性。...此次短视频功能的推出,既能对自身的生态进行扩容,也能助推进行业务场景拓展。倘若短视频功能发展顺利,或将在未来成为重要的变现途径之一。...最后,的新业务也不占优。据发布的财报显示,第四季度的营收为379.2亿元,同比增长了34.7%;新业务和其他业务经营亏损为60.03亿元,其中有一半的亏损来自优选。

45830

深度学习系统的工程实践

本文将介绍平台在应用深度学习技术的过程中,相关系统设计的一些经验。 本文将首先列举部分深度学习算法所需的计算量,然后再介绍为满足这些计算量,目前业界比较常见的一些解决方案。...最后,我们将介绍平台在NLU和语音识别两个领域中,设计相关系统的经验。 深度学习的计算量 ?...如此庞大的计算量,已经远远超出传统的机器学习算法的范畴。...的定制化深度学习系统 尽管目前在业界已经推出了很多著名的深度学习训练平台,通用的训练平台如TensorFlow、MxNet等等,还有领域专用的训练平台,如语音识别中的Kaldi,但是我们经过调研后,...---------- END ---------- 也许你还想看 基于TensorFlow Serving的深度学习在线预估 深度学习点评推荐平台排序中的运用 如何基于深度学习实现图像的智能审核

74930

机器学习算法岗实习四面面经(推荐系统方向)

“ 本篇内容为师妹在面试时的相关记录,希望对目前学习推荐系统方向的朋友们一些方向指引,同时也希望对寻找推荐系统相关工作的朋友们一些借鉴意义。如有相关问题,请后台留言交流。”...04 — 三面 1、详细描述工作,画出来整体框架 2、工作最大创新点,在代码实现方面遇到的难点 3、看你对比的都是传统的或者是基于图的推荐算法,有没有尝试过对比一下或者有没有了解其他不同数据源的深度学习算法...---- 以上是全部流程啦,其中一面是电话面的,后三面是去到现场面的(时间会提前跟我们沟通好的),一个下午面完,感觉效率很高,全程感觉也比较好,面试官会根据我们经历,顺着我们的话去深挖,也会结合业务去一块讨论

1.4K30
领券