首页
学习
活动
专区
工具
TVP
发布

用户画像--《机器学习实践》笔记

最近学习了用户画像方面的内容,本文主要是学习机器学习实践》的读书笔记。什么是用户画像?用户模型和用户画像的区别。...用户画像数据挖掘画像数据挖掘架构用户画像标签体系,从开发实现,通常分为两大类:经过策略统计分析(通过统计);经过机器学习模型预测。...机器学习模型有特征库后,就需要对标签做机器学习建模。需要用算法完成:特征选择,模型训练,效果评估,预测。模型训练常用工具:spark MLib,sklearn,XGBoost,Tensorflow等。...以推荐业务为例:推荐业务根据每个用户的画像进行个性化推荐,展示改用户可能感兴趣的购单或者店铺。...以推送业务为例:推送业务从海量用户中筛选出目标用户人群 ,向他们发送优惠券或者促销通知。这其中重要环节就是通过画像搜索人群。

3.5K183
您找到你想要的搜索结果了吗?
是的
没有找到

技术解析】机器学习配送系统的实践:用技术还原真实世界

技术解析 ? × 全文共计6532字 预计阅读时间17分钟 简介:何仁清,配送AI方向负责人。...本文重点解读在即时配送领域机器学习技术的最新进展,构建对线下真实世界各种场景的感知能力,还原并预测配送过程各个细节。...为了满足这些要求,我们建设了“超脑”配送系统,包含以下几个方面: 大数据处理和计算能力 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。...机器学习技术挑战 如何构建一个在真实物理世界运行的AI系统,就是我们最大的挑战。...通过机器学习方法,我们已经将外卖配送几乎所有环节都进行了精准预估预测。

85850

推荐算法实践:机器学习重排序模型

本文介绍了网推荐系统的构建和优化过程中的一些做法,包括数据层、触发层、融合过滤层和排序层五个层次,采用了HBase、Hive、storm、Spark和机器学习等技术。...团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由技术团队成员撰写,介绍其推荐系统的构建和优化过程中的一些做法。 框架 ?...排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...用户主动行为数据记录了用户在平台上不同的环节的各种行为,这些行为一方面用于候选集触发算法(在下一部分介绍)中的离线计算(主要是浏览、下单),另外一方面,这些行为代表的意图的强弱不同,因此在训练重排序模型时可以针对不同的行为设定不同的回归目标值...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法

2K60

,正在改造

正在告别,将目光投向了全新的发展战局之中。对于来讲,这是一个新的开始,这同样是一次顺势而为。因为只有这样,才会和那些曾经和它一起成长起来的玩家们一道共赴一个全新的发展新纪元。...一 以往我们所认识的,更多地是和外卖一词联系在一起的,提及,在很多情况下,便会提及「外卖」的字眼。这是由本身的发展历程所决定的。...以往,提及,我们看到的更多的是,它在流量的获取上,规模的做大上所做的诸多动作,比如,与大众点评的合并;比如,收购摩拜单车等,都是这一现象的直接体现;现在,提及,沃恩看到的更多的是,它在科技研发上的投入...从今年以来的表现来看,我们同样可以非常明显地感受到,与科技之间的连接同样是越来越强了,科技给带来的改变越来越多了,科技让开始有了更多的想象空间。...结语 透过的财报,我们可以非常明显地感受到,在这条路上走得愈发坚定。这样一条路,便是开始告别以往的自己,投身到新科技的星辰大海之中。

38220

R 语言数据运营实战

本文将基于到店餐饮技术部的精细化数据运营实践,介绍 R 在数据分析与可视化方面的工程能力,希望能够抛砖引玉,也欢迎业界同行给我们提供更多的建议。...R 在数据产品中的落地实践 到店餐饮数据团队从 2015 年开始逐步将 R 作为数据产品的辅助开发语言,截至 2018 年 8 月,已经成功应用在面向管理层的日周月数据报告、面向数据仓库治理的分析工具...下图是到店餐饮数据团队在数据治理过程中,使用 R 开发的 ETL 间依赖关系可视化工具: ?...作者简介 喻灿,到店餐饮技术部数据系统与数据产品团队负责人,2015 年加入,长期从事数据平台、数据仓库、数据应用方面的开发工作。...同时也在研发和商业分析团队中积极推动 R 的发展。

98030

【揭秘】如何用机器学习优化推荐系统算法

本文介绍了网推荐系统的构建和优化过程中的一些做法,包括数据层、触发层、融合过滤层和排序层五个层次,采用了HBase、Hive、storm、Spark和机器学习等技术。...团作为国内发展较快的O2O网站,有着大量的用户和丰富的用户行为,这些为推荐系统的应用和优化提供了很好的条件。本文由技术团队成员撰写,介绍其推荐系统的构建和优化过程中的一些做法。 1、框架 ?...排序层主要是利用机器学习的模型对触发层筛选出来的候选集进行重排序。 同时,对与候选集触发和重排序两层而言,为了效果迭代是需要频繁修改的两层,因此需要支持ABtest。...1、用户主动行为数据记录了用户在平台上不同的环节的各种行为,这些行为一方面用于候选集触发算法(在下一部分介绍)中的离线计算(主要是浏览、下单),另外一方面,这些行为代表的意图的强弱不同,因此在训练重排序模型时可以针对不同的行为设定不同的回归目标值...只是根据算法的历史效果决定算法产生的item的位置显得有些简单粗暴,同时,在每个算法的内部,不同item的顺序也只是简单的由一个或者几个因素决定,这些排序的方法只能用于第一步的初选过程,最终的排序结果需要借助机器学习的方法

1K60

机器学习实践》第二章 特征工程

数据和特征决定了机器学习的上限,而模型和算法只是无限逼近这个上限而已。 基于大量数据的简单模型胜于基于少量数据的复杂模型;更多的数据胜于聪明的算法,而好的数据胜于多的数据。...概念 从数学角度讲,特征工程就是将原始数据空间变换到新的特征空间,或者说是换一种数据的表达方式,在新的特征空间中,模型能够更好地学习数据的规律。...+r_{f_kf_1}})} \Big] 其中, 封装方法 由于过滤方法与具体的机器学习算法相互独立,因此过滤方法没有考虑选择的特征集合在具体机器学习算法上的效果。...与过滤方法不同,封装方法直接使用机器学习算法评估特征子集的效果,它可以检测出两个或者多个特征之间的交互关系,而且选择的特征子集让模型的效果达到最优。...嵌入方法 将特征选择嵌入到模型的构建过程中,具有封装方法与机器学习算法相结合的优点,而且具有过滤方法计算效率高的优点,嵌入方法是实际应用中最常见的方法,弥补了前面两种方法的不足。

43130

实例详解机器学习如何解决问题

不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。...我们结合机器学习上的实践,介绍机器学习在解决工业界问题的实战中所需的基本技术、经验和技巧。...下文分为1)机器学习的概述,2)对问题建模,3)准备训练数据,4)抽取特征,5)训练模型,6)优化模型,7)总结 共7个章节进行介绍。 机器学习的概述: 什么是机器学习?...为什么要用机器学习解决问题?...对问题建模 本文以DEAL(购单)交易额预估问题为例(就是预估一个给定DEAL一段时间内卖了多少钱),介绍使用机器学习如何解决问题。

1.1K90

数据指标体系搭建实战

商家版中,为商家搭建的数据指标体系,很好的指导了商家的经营发展方向以及提供经营状况概览。 本文通过体验商家版经营数据子功能,对商家版数据指标体系搭建的情况做出一个概述。...商家版的店铺子功能下,有一个经营数据子版块,针对商家经营过程中的数据指标进行统计。 以下是数据指标搭建的具体概况,经营数据一共分为五个板块依次呈现,分别为总览、营业、流量、顾客和商品。...06 竞品分析 饿了么作为外卖市场上的绝对竞品,在数据指标体系搭建上值得对比。...商家版通过搭建为商家经营服务的数据指标体系,让商户更好的了解自己的经营状况;从而对于自身的发展以及服务做出相应的改变,也更加容易成为产品的忠实使用者。

1.3K30

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

70420

点评数据平台Kerberos优化实战

KDC是对该协议中第三方认证服务的一种具体实现,一直以来都是点评数据平台的核心服务之一,在Hive、HDFS、YARN等开源组件的权限认证方面有着广泛的应用。...优化之前,线上KDC服务启动的单进程;为最低风险的完成和点评数据的融合,KDC中keytab都开启了PREAUTH属性;承载KDC服务的部分服务器没有做RAID。...使用BDB提供的工具,查看点评数据平台KDC服务的BDB缓存命中率为99%,如图7所示。 ? 图6 无RAID多KDC进程服务器磁盘IO ?...图7 点评KDC缓存命中率 KDC AS处理能力在多进程做RAID条件下,有无preauth属性,KDC服务是否有瓶颈?如果有在哪里?...SRE组,离线计算组SRE负责人,2015年11月加入点评。

1.2K100

机器学习 如何解决问题?以为例

不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。...我们结合机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器学习InAction系列”标签的文章),介绍机器学习在解决工业界问题的实战中所需的基本技术、经验和技巧。...下文分为1)机器学习的概述,2)对问题建模,3)准备训练数据,4)抽取特征,5)训练模型,6)优化模型,7)总结 共7个章节进行介绍。 ---- 机器学习的概述: 什么是机器学习?...为什么要用机器学习解决问题?...---- 对问题建模 本文以DEAL(购单)交易额预估问题为例(就是预估一个给定DEAL一段时间内卖了多少钱),介绍使用机器学习如何解决问题。

77550

【AI in 】深度学习搜索广告排序的应用实践

、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。...另外,业界第一部全面讲述互联网机器学习实践的图书《机器学习实践》也即将上市,敬请期待。...海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍搜索广告场景下深度学习的应用和探索。...二、从机器学习到深度学习的模型探索 2.1 场景与特征 搜索广告业务囊括了关键词搜索、频道筛选等业务,覆盖了美食、休娱、酒店、丽人、结婚、亲子等200多种应用场景,用户需求具有多样性。...玉林,2015年5月加入,主要从事搜索广告排序相关的工程优化工作。 王新,2017年4月加入,主要从事GPU集群管理与深度学习工程优化的工作。

68530

智能支付稳定性测试实战

如果你想学习互联网金融的技术体系,亲历互联网金融业务的爆发式增长,如果你想和我们一起,保证业务产品的高质量,欢迎加入金融工程质量组。...本文根据高级测试开发工程师勋伟在第44期技术沙龙“千万级日活App的质量保证”的演讲整理而成。主要介绍了智能支付业务在稳定性方向遇到的挑战,并重点介绍QA在稳定性测试中的一些方法与实践。...背景 支付承载了全部的交易流量,按照使用场景可以将其分为线上支付和智能支付两类业务。...线上支付,支撑用户线上消费场景,处理所有线上交易,为购、外卖、酒店旅游等业务线提供支付能力;智能支付,支撑用户到店消费场景,处理所有线下交易,通过智能POS、二维码支付、盒子支付等方式,为商家提供高效...作者介绍 勋伟,高级测试开发工程师,金融服务平台智能支付业务测试负责人,2015年加入

1.3K40

智能配送系统的运筹优化实战

智能配送系统架构 配送业务场景复杂,单量规模大。下图这组数字是2019年5月配送品牌发布时的数据。 ? 更直观的规模数字,可能是每年给骑手支付的工资,目前已经达到几百亿这个量级。...同样非常重要的还包括图中另外四个子系统,在配送过程中做精准的数据采集、感知、预估,为优化决策提供准确的参数输入,包括机器学习系统、IoT 和感知系统、LBS系统,这都是配送系统中非常重要的环节,涉及大量复杂的机器学习问题...我们之前做了一些比较有意思的工作,比如基于历史最优指派的结果,用机器学习模型做剪枝。基于大量的历史数据,可以帮助我们节省很多无用的匹配方案评价。 动态性。...所以,我们需要进行基于学习的优化,优化不是单纯的机器学习模型,也不是单纯的启发式规则,优化算法是结合真实数据和算法设计者的经验,学习和演进而得。...目前,配送团队的研究方向,不仅包括运筹优化,还包括机器学习、强化学习、数据挖掘等领域。这里有很多非常有挑战的业务场景,欢迎大家加入我们,共同探索。

1.8K31

图灵机器学习平台性能起飞的秘密(一)

总第543篇 2022年 第060篇 图灵机器学习平台在长期的优化实践中,积累了一系列独特的优化方法。...总结 导语 图灵平台是履约平台技术部2018年开始自研的算法平台,提供模型全生命周期的一站式服务,旨在帮助算法同学脱离繁琐的工程化开发,把有限的精力聚焦于业务和算法的迭代优化中。...随着图灵机器学习平台的发展,图灵技术团队在内存优化、计算优化、磁盘IO优化三个方面沉淀了一系列性能优化技术。我们将以连载的方式为大家揭秘这些技术。...业务背景 图灵平台主要包括机器学习平台、特征平台、图灵在线服务(Online Serving)、AB实验平台四大功能,具体可参考《一站式机器学习平台建设实践》以及《算法平台在线服务体系的演进与实践》这两篇博客...作者简介 琦帆、立煌、兆军等,均来自到家事业群/履约平台技术部。 ---------- END ----------

45510
领券