但是昨晚逛朋友圈看到该课程的一个学生在他的公众号:《 医学僧的科研日记》,写了一个笔记:突变特征(Mutational signatures),让我很感动,就翻了翻 他的朋友圈,发现一个超级有意思的图及配文《朋友圈选美大赛
整体来看,平台支持灵活的标签及人群创建方式,使用者按照自己的想法任意圈选出想要的人群,按不同周期手动或自动选出人群包。此外也支持人群的跟踪分析,人群在多场景的应用等。 画像应用:提供基础标签分析及针对特定人群的标签分析,另外还提供人群圈选跟踪分析及线上应用等。 支持灵活的标签及人群创建方式,让客户能按照自己的想法任意圈选出想要的人群,按不同周期手动或自动选出人群包,支持人群的跟踪分析、人群在多场景的应用能力。 4.3 人群创建 4.3.1 人群实时创建 人群包实时创建类似上面描述的人群大小实时预估,区别是在最后人群创建是需要将圈选的人群包用户明细写入到存储中,然后返回人群包的大小给到用户。 4.4 人群跟踪应用 4.4.1 人群跟踪分析 在按照用户规则圈选出人群后,统一对人群进行常用指标(如活跃、交易等指标)的跟踪。
▍ 营销方案 这一类客户是目标用户,也可以看做是种子用户,通过相似人群扩散,可以扩散出最多100万这样的特征的目标用户群,然后通过广点通去触达这些相对较精准的目标用户群,实现低成本、高质量的拉新。
明确了人群需求后,数据的流程主要包括: 数据源准备: 圈选目标人群所需要的标签数据从哪里来? 火车票订单、酒店订单、红包卡券数据 标签生产: 按照场景人群逻辑,清洗加工标签 人群圈选: 以标签为限定条件,从全量用户中过滤圈选出目标人群 用户触达: 将用户数据传输到营销通道,对用户进行触达 效果评估 : 回收效果数据,持续优化人群圈选条件 3.2 CDP产品架构 CDP(CustomerDataPlatform)是基于用户实时数据标签,精准圈选目标用户并快速输出数据服务的数据产品,充分融合了低代码 标签列表 标签生产 (3)场景管理 运营场景的构建是将业务运营动作拆解成数据标签、人群圈选需求,基于标签和判断条件,将用户划分成一个个精细化的人群包,不同人群承接差异化的运营策略。 (4)人群画像 不同人群的用户画像构成是怎么样的,不同特征的用户,对运营转化的效果是否相同呢?人群画像的应用价值一是人群圈选过程中确定是否满足运营需求,二是事后效果分析时,不同特征用户进行对比分析。
平台为业务人员提供海量标签,支持快速圈选目标人群,同时提供精细化人群画像洞察能力,联动多渠道进行推送,并支持人群效果的数据查看,助力业务人员进行全链路用户运营。 04 用户画像平台能力 在平台建设层面,自如用户画像平台能力包含人群圈选,人群洞察、人群营销、营销效果分析,支持全链路定向用户营销。 人群圈选:通过人群圈选可进行精细化用户分层,而用户分层是个性化营销的基础。画像平台支持标签组合、分群组合以及 ID 数据上传 3 种方式,适应营销人员在不同场景下的圈选需求。 人群营销:支持 push/短信/优惠券等方式进行定向用户营销,例如圈选北京 7 日活跃用户,推送中秋礼包活动,进行节日关怀;圈选解约业主,通过短信活动触达,进行业主召回;自如的人群包对接至家服 CRM 04 小结 本次分享到此结束,希望你通过本文的学习能了解,对于产品、运营、分析师、客服等各个角色掌握用户画像的重要性;并且掌握画像平台能力建设:标签体系、人群圈选、人群洞察、人群营销、营销效果、标准接口
什么是RTARTA即Realtime API的简称,用于满足广告主实时个性化的投放需求,这里的实时是指API接口实时调用,比如定向人群包圈选可能都是T+1,甚至T+2。 2.广告主RTA人群圈选,营销目标,比如拉新、促活,用户分析。3.广告主离线算法模型,通过算法模型进行人群圈选输出。4.接口性能,因为API实时接口调用,接口调用要求较高,50ms-100ms。
3、业务实现 在搭建了人群圈选引擎之后,我们重点改造了我们的消息推送系统,作为人群精细化运营的一个重要落地点。 3.1 闲鱼消息推送简介 消息推送(PUSH)是信息触达用户最快捷的手段。 实时计算层:根据人群的筛选条件,从用户大宽表中,查询符合的用户数量和用户ID列表,为应用系统提供服务。 人群圈选前台系统:提供可视化的操作界面。 闲鱼PUSH系统:从人群圈选前台系统中获取人群对应的where条件,再从实时计算层,分页获取用户列表,给用户发送PUSH。在实现过程中,我们重点解决了分页查询的性能问题。 人群圈选系统为闲鱼精细化用户运营提供了强有力的底层能力支撑。同时,圈选人群,也可以应用到其他的业务场景,比如首页焦点图定投等需要分层用户运营的场景,为闲鱼业务提供了很大的优化空间。 5、未来 人群圈选引擎中的用户数据,我们目前是T+1导入的。这是考虑到人群相关的指标,变化频率不是很快,且很多指标(比如用户标签)都是离线T+1计算的,因此T+1的数据更新频度是可以接受的。
场景:适合HR、财务、销售部门的数据整理类办公人士 问题:如何圈选大于2000或小于800的数据? 解答:这个问题咋一看,好像用条件格式也可以搞定,不过本例我们介绍更快的方法 ,数据有效性的圈选无效法。 效果如下:大于2000,和小于800的数据都会被圈选。 ?
用户分层运营的方式一是基于运营的业务经验,将运营场景抽象成标签规则进行人群圈选和触达营销,另一个就是利用算法模型进行人货场的智能匹配。这两种运营方式各有什么优劣势呢? 最近CDP平台新增了很多算法挖掘的标签,扩展了基于算法模型直接输出目标人群的场景,通过AB对比,算法圈选的目标人群的转化效果要好于运营基于经验、规则人工圈选的效果。 有同学不禁问道,既然基于算法的运营过程不需要运营介入,省去人工圈选的动作,可以输出更精准的人群,转化效果更好,那是不是基于算法的智能运营可以取代基于经验的业务规则运营呢? 从上述案例可以看出,规则运营,需要具有具备良好的业务经验和一定的数据思维才能将目标用户识别条件标签化,主要特点如下: 优点 1.行动敏捷,明确运营场景以及人群圈选条件后,可以快速进行人群输出,是CDP平台运营可以自助圈选 2.基于模算法模型的人群圈选可以覆盖更多特征维度,用户分层能力更多样化、精细化。
Counting Varying Density Crowds Through Attention Guided Detection and Density Estimation CVPR2018 本文针对人群密度问题 将 检测方法和回归方法结合到一起,以此来提升人群密度估计精度 人群密度估计问题目前主要的方法有基于检测的和基于回归的方法。 在人群密度小的时候,基于检测的方法效果更好。在人群密度较大的时候,基于回归方法的效果比较好。 ? ? 本文的思路就是将 检测方法和回归方法结合起来,各取所长。
一、数据源 1、相似人群数据存在TDW库中,数据字典说明: CREATE TABLE sim_people_tdw_tbl( uid STRING COMMENT 'reader id', ', update_date STRING COMMENT 'update_date' ) 字段 类型 含义 uid string 用户标识 sim_uids string 与uid喜好相似的人群 ,格式为用户编号:相同阅读量,相似用户之间以逗号分隔 sim_num BIGINT 相似人群的人数 update_date string 数据日期 2、基础用户画像存在MongoDB中 Image [ 相似人群字典表 :return: 相似度最高的相似人群 """ user_similarity_list = sorted(cluster_dic.iteritems(), key : 相似人群的相似度字典表 :return: 相似人群画像字典表 """ cluster_profile_rs = {} for sim_user_obj in sim_users_profile_array
Push等,通过红包激励手段,召回流失用户 精准分流:产品功能迭代AB或营销活动投放,基于用户地域、性别等标签属性,进行流量的精准分层运营’ 客户关怀:生日关怀、会员福利、服务受损用户关怀,通过用户标签圈选目标用户后 标签口径不一致:用户画像、精准营销平台人群圈选、算法特征都会涉及到用户或商品标签,各个系统存在标签同义不同值、同值不同义的问题,导致标签复用度低、重复建设带来的成名和资源浪费,这也是中台要重点解决的问题 业务运营靠经验:一般精准营销平台强调基于标签圈人的能力,什么样的用户适合推什么样的产品,提供什么样的服务,靠运营同学人工操作,基于经验或数据分析,确定特定场景下的人群标签条件,圈选后进行后续营销动作。 1.4 产品目标 (1)提供数据源接入及管理功能,将数据开发线下对接开发流程线上化、自动化 (2)建立完善的用户、商品标签体系,提供人群圈选、场景配置能力,标签生产流程配置化,业务自助配置取代数据开发、 提供基于标签圈人的能力,精准圈定目标人群进行分析或数据输出 功能要点:人群列表,新增人群流程(圈选、excel等自定义上传、SQL语句)、人群画像、人群输出(接口或场景配置) (4)场景管理 目标:对接营销
该网络在几个常用的公开人群密度估计数据库上取得了不错的效果。 1 Introduction 拥挤场景解析的发展从简单的人群数值估计到 人群密度图估计,人群密度图可以提供额外的信息,因为同样数量的人可以分布在不同的位置,如下图所示 ? 生成准确的人群分布图挑战性比较大,其中一个主要的困难就是离散化的问题,人在图像中不是只占用一个像素,密度图需要保持局部邻域的连续性。其他的困难包括场景的多样性,相机角度的多样性。 以前基于CNN网络的人群密度估计主要采用了 multi-scale architectures,虽然取得了不错的性能,但是存在两个问题:当网络变深的时候, the large amount of training 人群密度估计从方法上来说可以分为三大类:detection-based methods, regression-based methods, and density estimation-based methods
,形成人群包,并用这些人群包和第三方 MA,投放系统做对接,实现定向的投放,触达目标客户。 然后使用标签,进行人群圈选、用户画像及人群洞察,然后对接下游 MA、CRM、规则引擎等系统,实现人群的定向营销,整个过程业务人员全部可以自助式的完成,真正意义上面向于业务方的营销平台,大大提高了营销的效率 极速分析:底层集成高性能的计算引擎,提供秒级的数据查询能力,例如用户做标签数据查询、人群圈选时,能享受到秒级的高效产品体验。 ● 数雁 × 基金:智能标签助力新基金打新 在基金行业,采用清算系统、自营 APP、OTS 系统、客服系统等数据,形成客户的五大类标签,在此基础上圈选出目标人群,例如长期客户、潜力用户、偏爱新基金用户等 智能化:除了已有的规则标签之外,未来也会集成算法标签、算法模型,实现标签价值的进一步挖掘,也可以提供类似 LookAlike 人群放大等更多标签场景。
运营要推送消息给用户,首先需要圈选一个人群去推送。 人群量需要管控:我们在圈选的时候,如果运营圈定的人数大于一个阈值,我们会走邮箱让主管确认是否需要圈选这么一个大的人群去推送。 这块有两个目的: 首先我们是认为推送的人群应该是精细化的,什么标签的人群应该收到什么的推送。不应该圈定一个庞大的人群去推送同一条文案的消息(新闻APP除外)。 在运营圈定人群后,我们会有单独的测试功能去「测试单个用户」是否能正常下发消息,文案链接是否存在问题。 这一个步骤是必须要做的,给用户发出的消息,首先要经过自己的校验。 线上消息有「去重」的逻辑: 在某段时间内,过滤掉重复消息 运营类消息推送(圈定人群的方式去下发消息)同一个用户需要相隔一段时间才能下发一次。 ?
Scale-adaptive Convolutional Nerual Network https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu 人群分析 Towards perspective-free object counting with deep learning ECCV2016 https://github.com/gramuah/ccnn 人群计数 Density Estimation for Crowd Counting AVSS 2017 https://github.com/svishwa/crowdcount-cascaded-mtl 人群计数 /hosseinm/med Panic,Fight,Congestion,Obstacle ,Neutral 人群异常检测 Anomaly Detection and Localization in Crowded Scenes 数据库 http://www.svcl.ucsd.edu/projects/anomaly/ 人群分析 Deep Spatio-Temporal Residual
人群服务 人群服务会运用于用户运营平台的“选用户”环节,数据的管理能够提供可选择的用户条件,进行前端渲染。 而选完条件后则涉及数据的去重,不同人群包之间的计算,在最后的运用环节又涉及到了加解密。 描述完了底层支持,下一个部分就是用户运营平台的表现层“用户圈选”,那数据平台到底是怎么为“用户圈选”提供能力的呢? 3-2、产品表现:用户圈选 在选取用户时须考量的产品功能为:圈选方式、圈选频次、圈选条件及人群服务。 实质上这4个功能的底层支持都来自于用户数据平台,用户运营平台则负责服务的运用及表现。 1)圈选方式 条件选取 这是在可视化、自助化选择用户条件后,通过与其取值范围进行比较经计算生成人群数据包的一种形式。 一般来说,具备抽象为可视化条件的数据使用较为高频,数据准确性较高。 4)人群服务 前面的部分描述的是如何选取用户,而这一部分则是选了后还要做的事情。 其执行流程如下: 通过条件查询得到了人群包,然后对不同人群包进行交并叉相关的数学计算。
重点在于快速完成人群包圈选同时在圈选条件变更过程中,需要快速计算出预计能圈的用户有哪些? 2、用户分析。 针对简单的筛选,要求在秒级别出结果,针对复杂的人群筛选,筛选后人群量大的情况,要求在 20s 内完成人群包生成。 3、人群包除了 long 类型的用户 id 外,还需要有多种不同的设备 id 和设备 id md5 作为筛选结果。 2、人群预估。人群预估基本可在 1s 内完成,P95 985ms。 3、人群圈选。人群圈选过程在 5s 内完成,整体圈人在 2min 左右。(待提升中介绍) 4、人群分析。 在用户画像业务中,将用户 id 更换为设备 id,人群缩减(将具体人群包缩减为一个比较小的人群包用于后续运营动作)过程是通过业务代码实现的,降低了性能。
共享流量包是一种流量套餐产品,购买共享流量包后对该地域内公网服务按流量计费的云资源立即生效,自动抵扣产生的流量费用,直到共享流量包用完或到期为止。
扫码关注腾讯云开发者
领取腾讯云代金券