专栏首页容器计算推荐系统浅谈

推荐系统浅谈

1 推荐系统基础知识

从常用概念展开, 简要介绍基本原理和流程, 以便业务方了解如何构建和使用推荐系统

2 基本概念

2.1 推荐系统

通过将内容 (生产方) 与用户 (消费方) 进行匹配, 提供符合不同消费方各自偏好的内容, 在不同业务方的知识体系中可能会被称为: 智能分发, 个性化推荐, 千人千面

2.2 内容

平台或用户所生产出的成果, 可以为文章, 视频, 课程, 商品等

2.3 用户

对内容进行消费的对象, 可以为普通用户, 商业客户, 第三方服务等

2.4 行为

用户对内容产生的操作, 如点击, 收藏, 购买, 分享等, 通过日志记录存储后, 用于建立内容与用户的关联

2.5 标签

通过人工或机器的方法, 对内容和用户添加特征, 用来标识其特有属性, 可从内容本身中发现, 也可从用户行为中体现, 也可由用户自行填写, 如用户性别, 内容长度, 内容分类等

2.6 适用场景

什么时候引入推荐系统:

当内容和用户积累达到一定量级 (内容至少千级), 且内容分布达到一定宽度, 可分离出不同维度, 进而产生了用户对内容的偏好性, 需要对内容进行合理高效的分发以充分利用流量, 并开始要求高并发高实时的性能时, 可以开始考虑使用推荐系统

3 实现依赖

仅简要阐述实现推荐系统所需的功能组件, 是基本概念的具象化

3.1 内容画像

可包含:

  1. 标签, 类别等结构化特征
  2. 原始文本, 图片等非结构化特征
  3. 动态属性, 如用户行为的聚合

3.2 用户画像

可包含:

  1. 静态属性, 如一经确定不再变更, 如性别, 年龄等自然属性
  2. 动态属性, 在一定时间尺度内会有变更, 长期的如居住城市等社会属性, 中短期的如一个月内感兴趣的内容类型
  3. 用户行为, 通过分析用户对内容的行为, 建立起两个画像间的连接, 从对内容的态度可分为
  4. 显式反馈, 用户直接表现出的行为, 如点击, 分享, 评论
  5. 隐式反馈, 用户间接表现出的行为, 如停留时长, 点击次数, 搜索次数
  6. 正向反馈, 用户表现出的偏好行为, 如点赞, 收藏
  7. 负向反馈, 用户表现出的非偏好行为, 如点踩, 举报, 点不感兴趣

以上两个维度可以互相组合, 如显式负反馈, 隐式正反馈

4 个性化推荐策略

通过设计多种推荐策略, 召回不同内容, 组合后提供给用户, 以满足不同类型的需求

4.1 协同过滤

经典的推荐方法, 可以不基于预先准备的用户画像和内容画像体系, 依靠大量的用户与内容的关系行为, 对相似用户提供相似内容, 缺点是颗粒度依赖数据量, 且需要批量计算, 无法做到实时响应

4.2 长期

对于长期的关注和订阅需求, 在用户显式反馈后, 召回其下属内容, 给予推荐

4.3 短期

对于短期内的点击或搜索行为, 将基于内容的标签更新至用户画像后, 在下一次推荐中即可提供相关标签的内容, 从而达到准实时的响应, 提高用户体验

4.4 场景

对于不同业务, 可细分出不同场景下的差异, 如工作日与周末, 早晚高峰与睡前均会对内容存在不同偏好

4.5 热门候补

通过计算全局性的热门内容, 用于在冷启动或无更多个性化内容时, 扩充用户画像

4.6 负反馈

如果产品形态有负反馈功能, 如对某个标签不感兴趣, 对于用户显式负反馈的内容, 可在结果中进行过滤

5 数据驱动

新增功能和优化功能均需要经过以下环节评估效果

5. 1 线下|模型指标

针对不同业务场景, 设计对应方案, 使用不同模型, 用机器学习的指标评估模型效果, 达到一定基准线可进入线上环节

5.2 线上|A/B 测试

设计对照组和测试组, 切一部分真实流量, 运行一段时间后, 观察核心指标的差异, 如有提升可认为达到预期效果, 最终逐步替换现有方案

6 业务形态

涉及将内容分发给用户的场景均可使用, 推荐系统在广义上就是对用户画像和内容画像的有效使用, 因此除实现资讯流这样的具体产品形态外, 也可扩展至精准推送, 用户分层等, 以提供服务的形式满足更深层需求

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • sbt 项目导入问题

    有用过 sbt 开发项目的同学应该都有这样的体会,换个环境,sbt 经常会出现编译项目出错的情况,导入 IDEA 又各种报错,尤其是在 github 上找到一个...

    runzhliu
  • Delta Lake 学习笔记(一)

    今天 Spark + AI Summit 2019 宣布开源了 Delta Lake 这个项目,关于这个项目的背景我就不赘述了,砖厂官网有很多介绍,包括项目的 ...

    runzhliu
  • 【s3cmd】文件名一个空格带来的烦恼

    正常使用的 Ceph RGW,还有正常使用的 s3cmd,突然今天碰到一个用户反馈说,在使用 s3cmd get 时候出现大量的404,也就是下载对象 Obje...

    runzhliu
  • 干货 | 美图个性化推荐的实践与探索

    个性化推荐的目标是连接用户与内容、提升用户体验和优化内容生态。为了实现以上目标,算法需要理解内容,了解平台上可用于推荐的内容;同时也要理解用户,了解用户的兴趣爱...

    美图数据技术团队
  • 社区产品如何利用用户的个人沉淀内容创造价值【社区类APP探讨②】

    社区产品的一个很重要的目标就是让用户能够在社区里面创造内容,同时,用户留下的内容成为了他在这个社区的个人沉底,而这种个人沉底也是社区能够留住用户的一个重要砝码。...

    腾讯大讲堂
  • 数据运营实战(三):用数据说话,从埋点开始

    埋点是 App 数据运营中很重要的一个环节。之前我们讨论过用户分群的方式、漏斗转化的改进,但所有 App 数据的来源是数据采集,很多时候就是 App 的埋点。

    腾讯大数据
  • (二)市场+运营+商务需要积累什么?

       上次说到渠道商务的局限性,权限有限可运作的范围也有限,但对于渠道不能光是坐等资源上门,对于有潜力的APP产品应该懂得挖掘......接触越来越多的开发者以...

    大葡萄
  • 关于网站SEO优化,我只做四件事

    在SEO网站优化的过程中,多数人讲网站优化,就是讲网站的架构,关键字,标题,描述,dofollow,nofollow,sitemap,伪静态,H标签,关键字密度...

    神勇大师兄
  • 内容运营连接用户和产品之间的纽带!

    内容运营连接用户和产品之间的一种主要表现方式,是整个运营中非常重要的一部分。这几年互联网里面也开始推崇一种“内容为王”的说法。如何理清内容运营里面的各种关系,是...

    大葡萄
  • 通过js获取当前访问的根域名

    本文由 Alone88 创作,采用 知识共享署名4.0 国际许可协议进行许可 本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名 最后编辑时间为...

    Alone88

扫码关注云+社区

领取腾讯云代金券