场景:适合HR、财务、销售部门的数据整理类办公人士 问题:如何圈选大于2000或小于800的数据? 解答:这个问题咋一看,好像用条件格式也可以搞定,不过本例我们介绍更快的方法 ,数据有效性的圈选无效法。 具体操作如下:选中下表中Week Number的区域,单击“数据-数据验证”(2013以下版本叫数据有效性)。(下图2处) ? 然后在新弹菜单中,允许选择“整数”,设置数据介于800到2000之间有效。(如下图3、4处) ? 单击“确定”后完成条件设置,然后单击“数据-数据验证–圈释无效数据”按钮。立刻搞定。 ? 效果如下:大于2000,和小于800的数据都会被圈选。 ?
本次我们把人群圈选系统与原有的PUSH系统打通,极大地改善了此类PUSH的准备数据以及发送的效率,解放了开发资源。 3.2 系统架构 ? 离线数据层:用户维度数据,分散在各个业务系统的离线表中。 我们通过离线T+1定时任务,把数据汇总导入到实时计算层的用户大宽表中。 实时计算层:根据人群的筛选条件,从用户大宽表中,查询符合的用户数量和用户ID列表,为应用系统提供服务。 人群圈选前台系统:提供可视化的操作界面。运营同学选择筛选条件,保存为人群,用于分析或者发送PUSH。每一个人群,对应一个SQL存储。 人群圈选系统为闲鱼精细化用户运营提供了强有力的底层能力支撑。同时,圈选人群,也可以应用到其他的业务场景,比如首页焦点图定投等需要分层用户运营的场景,为闲鱼业务提供了很大的优化空间。 5、未来 人群圈选引擎中的用户数据,我们目前是T+1导入的。这是考虑到人群相关的指标,变化频率不是很快,且很多指标(比如用户标签)都是离线T+1计算的,因此T+1的数据更新频度是可以接受的。
移动推送、BI、云数仓Doris、ES、数据湖DLC、WeData、流计算Oceanus,多款产品助您高效挖掘数据潜力,提升数据生产力!
明确了人群需求后,数据的流程主要包括: 数据源准备: 圈选目标人群所需要的标签数据从哪里来? 火车票订单、酒店订单、红包卡券数据 标签生产: 按照场景人群逻辑,清洗加工标签 人群圈选: 以标签为限定条件,从全量用户中过滤圈选出目标人群 用户触达: 将用户数据传输到营销通道,对用户进行触达 效果评估 : 回收效果数据,持续优化人群圈选条件 3.2 CDP产品架构 CDP(CustomerDataPlatform)是基于用户实时数据标签,精准圈选目标用户并快速输出数据服务的数据产品,充分融合了低代码 CDP定位是服务于全集团,除了公共的数据标签外,需要支持不同业务条线基于自身业务属性参与标签共建,标签目录及元数据公开,申请权限后方可进行人群圈选。 丰富的标签资源是产品的核心优势之一,覆盖用户基本属性、行为轨迹、营销属性、消费属性、实时定位属性、以及算法预测六大类标签。标签时效性包括实时标签以及离线标签。
平台为业务人员提供海量标签,支持快速圈选目标人群,同时提供精细化人群画像洞察能力,联动多渠道进行推送,并支持人群效果的数据查看,助力业务人员进行全链路用户运营。 04 用户画像平台能力 在平台建设层面,自如用户画像平台能力包含人群圈选,人群洞察、人群营销、营销效果分析,支持全链路定向用户营销。 人群圈选:通过人群圈选可进行精细化用户分层,而用户分层是个性化营销的基础。画像平台支持标签组合、分群组合以及 ID 数据上传 3 种方式,适应营销人员在不同场景下的圈选需求。 人群营销:支持 push/短信/优惠券等方式进行定向用户营销,例如圈选北京 7 日活跃用户,推送中秋礼包活动,进行节日关怀;圈选解约业主,通过短信活动触达,进行业主召回;自如的人群包对接至家服 CRM 04 小结 本次分享到此结束,希望你通过本文的学习能了解,对于产品、运营、分析师、客服等各个角色掌握用户画像的重要性;并且掌握画像平台能力建设:标签体系、人群圈选、人群洞察、人群营销、营销效果、标准接口
Scale-adaptive Convolutional Nerual Network https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu 人群分析 Network for Dense Crowd Counting Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet 人群数据库 Novel Dataset for Fine-grained Abnormal Behavior Understanding in Crowd 人群异常行为数据库:https://github.com /hosseinm/med Panic,Fight,Congestion,Obstacle ,Neutral 人群异常检测 Anomaly Detection and Localization in Crowded Scenes 数据库 http://www.svcl.ucsd.edu/projects/anomaly/ 人群分析 Deep Spatio-Temporal Residual
省份:山东、江苏和北京大学生较多 大学生人群省份占比中,山东占比排名第一,为5.9%;其次是江苏,占比5.8%;对比移动互联网整体,广东和浙江大学生人群相对较少。 ? 品牌:大学生青睐小米和华为等国产机 大学生人群设备品牌分布中,小米排名第一,占比28.6%,华为排名第二。 对比移动互联网整体,大学生使用三星的比例仅为整体的一半,且大学生人群所用设备品牌较为集中,TOP10设备占比达到96%。 ? Part3 大学生行为分析 活跃时段:大学生在早上八点之后开始活跃 大学生人群活跃时段从早上八点开始,全天都处于一个较为平衡的活跃中,可见手机已经成为大学生生活中必不可少的东西,机不离手成为大学生的新兴生活方式 线下消费:女生关注箱包、男生关注生活服务 大学生人群线下消费偏好中,男女生关注点存在差异,女生关注运动健康、箱包、化妆品等品类;男生关注生活服务、餐饮等。 ?
下载数据集请登录爱数科(www.idatascience.cn) Lending Club平台2012-2018年的贷款数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
一直以来,好位置、低总价、好配套,是购房者选房时最看重的三大因素。那么~ 在现时的北京,哪里还有这样的房子?想买均价5万以下的房子,哪里的性价比最高? 腾讯位置服务联合腾讯房产、摩拜单车发布此份腾讯位置大数据之《北京交通等时圈选房指南》,基于“好位置、低总价、好配套”三大因素,结合位置大数据进行计算,并引入“公共交通便利性”“生活便利性”“性价比指数” 1 公共交通设施 公共交通:四环内小区公共交通便利性普遍较好,五环外仅回龙观通州等地区公共交通便捷 公交地铁是城市人群重要的出行方式,一个区域的公共交通便利性可以用这个区域周边地铁站和公交站的数量衡量。 我们将以北京五大工作聚集区——中关村、西二旗、国贸、金融街和望京为例,结合交通等时圈数据来推荐高性价比区域。 ? 70%的人群,构成了当前全球最顶尖的位置大数据库,其完整性完全能适用于进行科学研究与分析; – 合法:保护用户隐私,不收集设备上的个人信息,并对数据进行匿名化、模糊化处理,使其无法追踪到具体个人; 平台能力
完备性:指数据丰富、规则灵活、功能完善;支持丰富的人群圈选数据,预置标签、人群标签、平台行为、自定义上报行为等。做到在不违反隐私的情况下平台基本提供使用者想要的数据。 画像应用:提供基础标签分析及针对特定人群的标签分析,另外还提供人群圈选跟踪分析及线上应用等。 在功能设计上,平台需要做到数据丰富、规则灵活、查询快速,需要支持丰富的人群圈选数据,并且预置标签、人群标签、平台行为、自定义上报行为等。 而画像大宽表需要等待所有画像标签均完成后才能开始执行该宽表数据的生成,会导致数据的延时风险增大。当需要新增或删除标签时,需要修改表结构。 标签类型数据用 Bitmap 类型存储,平台行为采用编码方式存储,存储占用大幅减少。 4.2.3 数据查询 数据查询方式:人群圈选过程中,如何保障大的APP查询、在复杂规则情况下的查询速度?
最近CDP平台新增了很多算法挖掘的标签,扩展了基于算法模型直接输出目标人群的场景,通过AB对比,算法圈选的目标人群的转化效果要好于运营基于经验、规则人工圈选的效果。 一、基于业务经验的规则运营 规则运营是指将业务精细化运营的场景需求,抽象成目标用户筛选的标签条件,利用CDP(或DMP)等精准营销平台或者数据开发数据加工进行用户圈选、营销触达。 从上述案例可以看出,规则运营,需要具有具备良好的业务经验和一定的数据思维才能将目标用户识别条件标签化,主要特点如下: 优点 1.行动敏捷,明确运营场景以及人群圈选条件后,可以快速进行人群输出,是CDP平台运营可以自助圈选 3.实现成本低,按照规则的圈选或数据清洗,运营+平台工具或运营+数据开发需要人力成本以及计算成本都比算法模型要低很多。 2.基于模算法模型的人群圈选可以覆盖更多特征维度,用户分层能力更多样化、精细化。
但在数据化运营层面,品牌商家仍然面临着投放层面的三大难题: 其一是投前看不懂。 对于品牌商家而言,总是希望通过更丰富的数据去了解消费者。 发现巨量引擎营销科学旗下数据资产经营管理平台巨量云图,给品牌商家带来了【818商家云图作战大图】,已经很好地破解品牌商家的这三大痛点,特别推荐给大家(可点击图片放大仔细了解),在接下来的日常营销和年终双 为了提升投放精准度,其服务商聚睿数据运用货品行业洞察数据,明确200~1000元价格带白酒市场的核心购买人群画像,为古井贡酒制定了清晰的人群圈选策略: 一个是通过内容兴趣挖掘到的白酒品类的目标人群,另一个则是通过白酒类目的维度下钻 当然,圈选目标人群的过程不是一步到位的,在投放过程中,巨量云图对目标人群的优化有着相当落地的方法。 比如818期间,小仙炖大概投入了近百万进行精准的人群投放测试,方法很聚焦: 通过巨量云图的机会人群标签优选,将小仙炖过往的历史投放和销售数据,结合本次818圈选的目标人群,根据多维的指标特征将品牌初步圈选的人群分为重点拉新人群
众所周知,我们的系统都有几套的环境(比如说本地/线下/预发/线上 环境),其中大多数公司的预发和线上环境数据库是同一套的,只是预发环境调用的是预发环境的接口,线上环境调用的是线上环境的接口而已。 运营要推送消息给用户,首先需要圈选一个人群去推送。 人群量需要管控:我们在圈选的时候,如果运营圈定的人数大于一个阈值,我们会走邮箱让主管确认是否需要圈选这么一个大的人群去推送。 这块有两个目的: 首先我们是认为推送的人群应该是精细化的,什么标签的人群应该收到什么的推送。不应该圈定一个庞大的人群去推送同一条文案的消息(新闻APP除外)。 在运营圈定人群后,我们会有单独的测试功能去「测试单个用户」是否能正常下发消息,文案链接是否存在问题。 这一个步骤是必须要做的,给用户发出的消息,首先要经过自己的校验。 线上消息有「去重」的逻辑: 在某段时间内,过滤掉重复消息 运营类消息推送(圈定人群的方式去下发消息)同一个用户需要相隔一段时间才能下发一次。 ?
二、POI和地理围栏的应用场景 1.用户特征识别信息盲点补充 人群的差异化运营几乎是现在每个精细化运营的企业都在做的事情。 白领、学生、医护、蓝领用户群体差异性非常大,对于外卖类的电商平台,供给侧要充分考虑群体的消费能力的差异,才能更好提高转化。 例如,小区周边新开了一家生鲜买菜的线下体验店,需要对曾经在周边1Km内取菜点取过菜的用户进行短信推送,吸引用户前来光顾,此时主要会用到【XX小区】+【周边1Km】+【订单数>0】等标签条件,来圈选出目标人群 即,建立完善的LBS类的标签,与已有的精准营销平台打通,实现从圈选到营销触达的一站式能力。数据产品规划时,针对LBS标签需求提供灵活的配置能力。 ,为广告投放提供决策支撑 区域圈选:通过多种条件筛选出目标POI或周边区域,如POI类型、属性、省份、城市、具体地址信息等,离线场景直接圈选目标人群,实时场景输出区域规则 服务输出:圈选的目标区域,作为
二、vivo营销自动化平台产品架构 vivo营销自动化平台主要分为四大业务模块: 2.1. 人群管理模块 人群管理模块主要作用为营销自动化系统提供目标受众,完成精细化分群。 人群管理模块技术挑战点有: 提供实时人群圈选的海量大数据OLAP技术; 提供超大规模数据处理技术。 人群管理模块主要功能有:线索管理、身份管理、潜客管理、人群管理、人群圈选、人群抽样、人群扩量、人群定向和客流洞察功能。 2.2. 营销策略模块 营销策略模块主要作用为营销自动化系统提供策略方案库。 三、 vivo营销自动化平台系统架构 3.1 系统架构 【网关层】Nginx负载均衡; 【服务层】主要部署的应用服务模块为人群圈选服务、活动配置服务,方案执行服务、投放服务、度量服务。 人群圈选:提供人群创建、人群管理、人群计算、人群定向功能; 活动配置:负责对接运营后台的管理配置业务,提供基础的配置能力和信息接口; 方案执行:负责活动真正的执行过程,包括活动触发和数据处理; 投放服务
然后每次有营销活动,业务人员都会提供营销的规则,大数据开发再基于这些规则,利用标签宽表,筛选出对应的人群,形成人群包,并用这些人群包和第三方 MA,投放系统做对接,实现定向的投放,触达目标客户。 数雁产品线主要分两大产品,分别为指标管理分析和客户数据洞察产品。 底层的一站式数据开发与治理产品,对原始的业务数据,清洗加工完成后,形成的有效资产数据,然后数雁对接这些资产数据,实现数据价值的放大。 然后使用标签,进行人群圈选、用户画像及人群洞察,然后对接下游 MA、CRM、规则引擎等系统,实现人群的定向营销,整个过程业务人员全部可以自助式的完成,真正意义上面向于业务方的营销平台,大大提高了营销的效率 极速分析:底层集成高性能的计算引擎,提供秒级的数据查询能力,例如用户做标签数据查询、人群圈选时,能享受到秒级的高效产品体验。 ● 数雁 × 基金:智能标签助力新基金打新 在基金行业,采用清算系统、自营 APP、OTS 系统、客服系统等数据,形成客户的五大类标签,在此基础上圈选出目标人群,例如长期客户、潜力用户、偏爱新基金用户等
精准投放所依赖的数据在广告主侧,基于数据安全的考虑不会把数据同步到媒体侧,又想达到目的,那么基础数据都不出来,通过加密设备编号进行问询就好了。联邦学习也是一种方式,实现成本高,实际也不知是否真的适用? 什么是RTARTA即Realtime API的简称,用于满足广告主实时个性化的投放需求,这里的实时是指API接口实时调用,比如定向人群包圈选可能都是T+1,甚至T+2。 2.广告主RTA人群圈选,营销目标,比如拉新、促活,用户分析。3.广告主离线算法模型,通过算法模型进行人群圈选输出。4.接口性能,因为API实时接口调用,接口调用要求较高,50ms-100ms。
面对这种情况不用着急,只需要根据用户特征初步判断其所属人群后,通过用户画像为客户量身制定相关喜好或潜在喜好的推荐,直接将针对该人群的运营策略应用于该客户身上,便能直接切入客户心之所向,大大提升用户体验和服务效率 如:需要圈选出使用APP活跃度高且偏好电销渠道和自营APP渠道的用户,则可在「客户数据洞察平台」进行如下配置: 图片 条件的设置主要包含两部分因素:时间和标签结果值。 ● 群组画像分析 针对圈选的用户,系统统计出每个标签的实例数情况,用户根据这个数据结果查看标签分布情况,判断群组在各标签上是否有一些典型特征。 TGI结果以100为基准:当TGI>100时表示目标人群更显著,TGI < 100时表示大盘人群更显著。 除了在当前群体内部做特征分析,也可以和其他群体做比较分析,来确定当前群组有何突出特点。 此时,就需要去比较群组间的差异性,更多的保留差异性大的群组,根据实际需要,对差异性小的群组进行适当取舍。 利用群组交集分析功能,可以查看群组间的交集量级及交集的数据详情。
标签口径不一致:用户画像、精准营销平台人群圈选、算法特征都会涉及到用户或商品标签,各个系统存在标签同义不同值、同值不同义的问题,导致标签复用度低、重复建设带来的成名和资源浪费,这也是中台要重点解决的问题 业务运营靠经验:一般精准营销平台强调基于标签圈人的能力,什么样的用户适合推什么样的产品,提供什么样的服务,靠运营同学人工操作,基于经验或数据分析,确定特定场景下的人群标签条件,圈选后进行后续营销动作。 1.4 产品目标 (1)提供数据源接入及管理功能,将数据开发线下对接开发流程线上化、自动化 (2)建立完善的用户、商品标签体系,提供人群圈选、场景配置能力,标签生产流程配置化,业务自助配置取代数据开发、 前端开发 (3)标签、人群服务输出,以API或数据推送方式为用户营销、产品运营提供服务 (4)管理应用注册及调用信息,构建完整的数据链路血缘 (5)融入算法推荐能力,实现人货场精准匹配 (6)用户群体: 提供基于标签圈人的能力,精准圈定目标人群进行分析或数据输出 功能要点:人群列表,新增人群流程(圈选、excel等自定义上传、SQL语句)、人群画像、人群输出(接口或场景配置) (4)场景管理 目标:对接营销
人群管理模块技术挑战点有: 提供实时人群圈选的海量大数据OLAP技术; 提供超大规模数据处理技术。 人群管理模块主要功能有:线索管理、身份管理、潜客管理、人群管理、人群圈选、人群抽样、人群扩量、人群定向和客流洞察功能。 2.2. 营销策略模块 营销策略模块主要作用为营销自动化系统提供策略方案库。 系统架构 [68c7e6a2fe6f45cf84a45c6135c5a002~tplv-k3u1fbpfcp-zoom-1.image] 【网关层】Nginx负载均衡; 【服务层】主要部署的应用服务模块为人群圈选服务 人群圈选:提供人群创建、人群管理、人群计算、人群定向功能; 活动配置:负责对接运营后台的管理配置业务,提供基础的配置能力和信息接口; 方案执行:负责活动真正的执行过程,包括活动触发和数据处理; 投放服务 【计算层】主要包括基础数据服务、自动化方案执行和渠道触达服务 数据服务:提供数据洞察、人群计算、智能分群和人群定向功能。
腾讯云图 (TCV)是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示海量数据,10 分钟零门槛打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,无需编码,全图形化编辑,快速可视化制作……
扫码关注腾讯云开发者
领取腾讯云代金券