首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

搜推广遇上用户画像:Lookalike相似人群拓展算法

在《当推荐系统遇上用户画像:你的画像是怎么来的?》一文中,我们介绍了怎么通过TF-IDF的方式得到用户画像。而在本文中,我们来聊一下在搜索、推荐、计算广告系统中“画像是怎么用的?”。...答案是肯定,不然我费劲巴拉的写这篇文章干嘛,躺着刷刷视频不香吗...言归正传,相似人群拓展(Lookalike)的工作机制是基于种子用户画像和社交关系链寻找出相似用户。...图片引用来自参考资料1 具体来讲,相似人群拓展(Lookalike)是基于种子用户,通过用户画像、算法模型等找到与种子用户更多拥有潜在关联性的拓展技术。...图片引用来自参考资料1 Lookalike相似人群拓展方法主要有以下几种方式, 利用用户画像进行显式人群拓展:根据种子用户的标签(地理、兴趣、行为、品牌偏好等),利用相同标签找到目标人群; 利用机器学习模型进行隐式人群拓展...腾讯社交Lookalike 腾讯社交广告团队基于种子用户画像和关系链寻找相似用户,即根据种子人群的共有属性进行自动化扩展,以扩大受众覆盖面,提升广告效果。

3.6K40

相似人群画像算法

2、基础用户画像存在MongoDB中 Image [2].png 字段 含义 _id 用户id profile(离线)positive(实时) 用户画像(喜欢),每个维度以分号间隔,每个子维度以逗号间隔...或city 城市编码 3、相似人群画像也存在MongoDB中 QQ截图20180719095235.png 二、整体思路 由于TESLA集群无法直接操作MongoDB,需要将TDW里面的用户画像数据...:user的权重,公式为相似/(相似+10),区间为(1/3,10/11) :return:指定维度的群画像 """ if user_dimension !...:param similarity_low: 相似最低值 :param similarity_high: 相似最高值 :param uid_hdf: 用户编号 :param...: 相似人群的相似字典表 :return: 相似人群画像字典表 """ cluster_profile_rs = {} for sim_user_obj in sim_users_profile_array

2.2K61
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    相似计算——余弦相似

    余弦相似介绍 余弦相似是利用两个向量之间的夹角的余弦值来衡量两个向量之间的相似,这个值的范围在-1到1之间。...两个向量的夹角示例图如下: 余弦相似的计算公式 向量的余弦相似计算公式 余弦相似计算的示例代码 用Python实现余弦相似计算时,我们可以使用NumPy库来计算余弦相似,示例代码如下: import...余弦相似相似计算中被广泛应用在文本相似、推荐系统、图像处理等领域。...如在文本相似计算中,可以使用余弦相似来比较两个文档的向量表示,从而判断它们的相似程度。 又如在推荐系统中,可以利用余弦相似来计算用户对不同商品的喜好程度,进而进行商品推荐。...如果两篇文章的余弦相似接近1,那么它们在内容上是相似的; 如果余弦相似接近0,则它们在内容上是不相似的。 这样的相似计算方法可以在信息检索、自然语言处理等领域得到广泛应用。

    21610

    用户画像

    和上一小节讲的用户人群功能相似,人群分析功能首先也需要组合标签圈定用户群体,不同之处在于多维透视分析功能支持从多个维度去分析圈定用户群体的特征,而用户分群功能侧重的是将筛选出来的用户群推送到各业务系统中...图10 创建需要分析的人群 创建好目标用户群体后,在“对比维度”选择菜单中选择需要分析该批用户的维度(如图11所示),例如这里选择的是下单次数和活跃。...图11 对目标人群选择需要分析的维度 选择好透视分析的维度,下面就可以看到刚才筛选出来的用户群在活跃和下单次数上的表现了(如图12所示)。 ?...图13 对比分析两个人群特征 本文介绍了用户画像产品化主要涵盖的功能模块以及这些模块的应用场景。用户画像产品化是把数据应用到业务服务中的一个重要出口,业务人员熟知业务,但对数据不了解。...本文摘编于《用户画像:方法论与工程化解决方案》,经出版方授权发布。

    4.6K30

    文本相似 | 余弦相似思想

    计算文本相似有什么用?...反垃圾文本的捞取 “诚聘淘宝兼职”、“诚聘打字员”...这样的小广告满天飞,作为网站或者APP的运营者,不可能手动将所有的广告文本放入屏蔽名单里,挑几个典型广告文本,与它满足一定相似就进行屏蔽。...冗余过滤 我们每天接触过量的信息,信息之间存在大量的重复,相似可以帮我们删除这些重复内容,比如,大量相似新闻的过滤筛选。 这里有一个在线计算程序,你们可以感受一下 ?...余弦相似的思想 余弦相似,就是用空间中两个向量的夹角,来判断这两个向量的相似程度: ?...相似,个么侬就好好弄一个相似程度好伐?比如99%相似、10%相似,更关键的是,夹角这个东西—— 我不会算! 谁来跟我说说两个空间向量的角度怎么计算?哪本书有?

    2.8K70

    基于用户的协同过滤(余弦相似

    协同过滤 协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的...余弦相似 余弦相似用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0,也就是两个向量越相似,这就叫"余弦相似性"。 ? ?...NaN 4.0 NaN 4.0 NaN 5.0 NaN C 2.0 NaN 2.0 NaN 1.0 NaN NaN D NaN 5.0 NaN 3.0 NaN 5.0 4.0 目标: 我们要寻找 A 最相似的其他顾客...).values.reshape(1, -1)) sim_AB sim_AC OUT: array([[0.18353259]]) array([[0.88527041]]) 从上面看出A和C的比较相似...).values.reshape(1, -1)) sim_AB sim_AC OUT: array([[0.30772873]]) array([[-0.24618298]]) 去中心化后 A和C的相似是负的

    2.5K20

    计算相似

    在机器学习中,经常要度量两个对象的相似,例如k-最近邻算法,即通过度量数据的相似而进行分类。...在推荐系统中,也会用到相似的计算(当然还有其他方面的度量)。 本文中,将介绍业务实践中最常用的几种相似的度量方法。...基于相似性的度量 皮尔逊相关系数 斯皮尔曼秩相关系数 肯德尔秩相关系数 余弦相似 雅卡尔相似 基于距离的度量 欧几里得距离 曼哈顿距离 1....如果向量指向相同的方向,余弦相似是+1。如果向量指向相反的方向,余弦相似为-1。 ? ? 余弦相似在文本分析中很常见。它用于确定文档之间的相似程度,而不考虑文档的大小。...余弦相似和雅卡尔相似都是度量文本相似的常用方法,但雅卡尔相似在计算上成本较高,因为它要将一个文档的所有词汇匹配到另一个文档。实践证明,雅卡尔相似在检测重复项方面很有用——集合运算的特点。

    4.2K11

    用户画像构建

    用户画像是指用户的进行标签化、信息结构化。 构成用户画像的基本元素通常有:姓名、照片、个人信息、经济状况、工作信息、计算机互联网背景。...用来丰富用户画像的元素有:居住地、工作地点、公司、爱好、家庭生活、朋友圈、性格、个人语录等等。...创建用户画像的方法 用户画像的作用 精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销; 用户统计,比如中国大学购买书籍人数 TOP10,全国分城市奶爸指数; 数据挖掘,构建智能推荐系统...,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况; 进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务...; 对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户; 业务经营分析以及竞争分析,影响企业发展战略。

    3.7K11

    用户画像基础

    01 画像简介 用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌...中间的虚线框即为用户画像建模的主要环节,用户画像不是产生数据的源头,而是对基于数据仓库ODS层、DW层、DM层中与用户相关数据的二次建模加工。...图1-6 用户画像建设项目流程 第一阶段:目标解读 在建立用户画像前,首先需要明确用户画像服务于企业的对象,再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果。...就后文将要介绍的案例而言,需要从用户属性画像用户行为画像用户偏好画像用户群体偏好画像等角度去进行业务建模。...面向业务方推广应用:用户画像最终的价值产出点是业务方应用画像数据进行用户分析,多渠道触达运营用户,分析ROI,提升用户活跃或营收。

    4.1K50

    余弦相似与欧氏距离相似(比较记录)

    余弦相似公式: ? 这里的分别代表向量A和B的各分量。 原理:多维空间两点与所设定的点形成夹角的余弦值。...范围:[-1,1],值越大,说明夹角越大,两点相距就越远,相似就越小。 余弦相似模型:根据用户评分数据表,生成物品的相似矩阵; 欧氏距离相似公式: ?...原理:利用欧式距离d定义的相似s,s=1 /(1+d)。 范围:[0,1],值越大,说明d越小,也就是距离越近,则相似越大。...欧式相似模型:根据用户评分数据表,生成物品的相似矩阵; 总结: 余弦相似衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异,而欧氏度量的正是数值上的差异性。...主要看数值的差异,比如个人兴趣,可能数值对他影响不大,这种情况应该采用余弦相似 ,而物品的相似,例如价格差异数值差别影响就比较大,这种情况应该采用欧氏度量

    2.9K30

    用户画像小结

    前段时间做可一些用户画像方面的工作,对用户画像技术有了初步了解。如果你是一个对大数据和用户画像技术完全不了解的小白,希望这篇文章可以提供一点帮助。...在项目开展前,当然要先了解用户画像主要是干什么的,下面是我总结的两篇文章,大家可以先对大数据和用户画像有个基本的认识。...用户画像--《美团机器学习实践》笔记 如果刚接触用户画像,可以先通过以上两篇文章对用户画像挖掘和应用有初步了解。如果你读完以后是一脸懵的话,我知道你很急,但是你先别急。...使用pyspark实现RFM模型及应用(超详细) 利用用户的消费流水,对用户的消费水平打标签~实现简单的用户付费画像。..."的兴趣是"0.5"~短期(天)兴趣画像就出来啦~ 以上内容阐述了如何通过最直观简洁的方式来构建用户画像,让大家对用户画像的概念有更深入的理解。

    609111

    用户画像总结

    在产品早期和发展期,会较多地借助用户画像,帮助产品人员理解用户的需求,想象用户使用的场景,产品设计从为所有人做产品变成为三四个人做产品,间接的降低复杂。...、偏好、人口统计学特征,主要目的是提升营销精准度、推荐匹配,终极目的是提升产品服务,起到提升企业利润。...(4)营销模型预测 利用模型预测层结果,对不同用户群体,相同需求的客户,通过打标签,建立营销模型,从而分析用户的活跃、忠诚、流失度、影响力等可以用来进行营销的数据。...对于文本的特征数据,其主要使用相似计算,如余弦夹角,欧式距离等。 模型标签层。使用机器学习的方法,结合推荐算法。模型标签层完成对用户的标签建模与用户标识。...通过建模分析,我们可以进一步挖掘出用户的群体特征和个性权重特征,从而完善用户的价值衡量,服务满意衡量等。 预测层。也是标签体系中的营销模型预测层。

    2.2K10

    文本相似计算_文本相似分析算法

    Simhash 计算文档相似的算法, 比如用在搜索引擎的爬虫系统中,收录重复的网页是毫无意义的,只会造成存储和计算资源的浪费。...有时候我们需要处理类似的文档,比如新闻,很多不同新闻网的新闻内容十分相近,标题略有相似。如此问题,便可以应用Simhash 文档相似算法,查看两篇文档相似程度,删去相似高的web文档。 二....但是,使用上述方法产生的simhash用来比较两个文本之间的相似,将其扩展到海量数据的近重复检测中去,时间复杂和空间复杂都太大。...Java 代码实现: package simhash; /** * Function: simHash 判断文本相似,该示例程支持中文 * date: 2013-8-6 上午1:11:48...self.hash ^ other.hash) & ((1 << self.hashbits) - 1) tot = 0; while x : tot += 1 x &= x - 1 return tot #求相似

    1.3K20
    领券