前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >我们是否需要一款个性化内容推荐引擎3.0

我们是否需要一款个性化内容推荐引擎3.0

作者头像
mixlab
发布2019-07-30 11:23:47
6260
发布2019-07-30 11:23:47
举报

这事情要从这说起,抖音天天给我推美女,淘宝天天给我推剃须刀,银行天天给我发信用卡提额短信……

我接收到的信息已经高度地重复,查看这些重复的信息已经浪费了我不少的时间

最近我一直在思考,我们是否需要自己设定想接受什么样的信息,而不是把被各种公司、大厂“喂养”,或者说“骚扰”吧。

然后,我就很自然地想到了,用户可以自定义的内容推荐引擎。本质上就是把算法所定义的变量(或者叫指标),抛给用户,用户来设定阈值。

如果从技术角度思考,这些用户恐怕都得是技术爱好者,才有此理解力去设定各种指标的阈值。普通用户是不懂、也不理解的。

这个时候,我们需要一款设计良好的足够贴近用户理解心智的内容推荐引擎产品,普通用户也可以很好的理解跟参与自定义自己喜欢的推荐方式。

新技术或者新设计,都是建立在以往所有已存在的技术或者设计的分解、重构的基础上的。所以我们先来看看,有哪些案例我们可以借鉴跟引起我们的思考。

01

自动分配流量池

“打怪升级的感觉”

抖音的内容推荐算法,介绍的文章已经非常多了,这里就不赘述了,简单的总结下。

抖音的推荐,总结来说就2步,第一步是小的流量池,第二步是更大的流量池,如此反复循环。如果短视频受用户欢迎,那就会不断地得到更多的播放量跟平台内的推荐。

这个被称为「流量池」,算法给每一个短视频分配一个流量池。算法根据短视频在这个流量池里的表现,决定是下一步是否推送给更多的用户。

这里有个特点,就是流量的分配是掌握在抖音手里的,虽然看起来相对公平。所有的抖音的用户,拍的任何一个短视频,发布之后一定会有播放量,从几十到上千都有可能。但最终是否真的可以获得更多的推荐完全取决于算法制定的规则是否公平,或者说其中没有人为的干预。

让内容可以在流量池中优胜劣汰,从而达到优质内容强势生长的目的。

02

内容质量评估

量化文章

今日头条的灵犬,预训练了反低俗模型,用于评估文章的质量。用户只需要输入任意一段文字或文章链接,即可获得一个健康分数。大体的流程是先分词、语义识别,然后根据算法规则,输出对应的分数、评级和结论。结论包括:是否可以获得算法推荐,是否需要引入人工判断等。

除了头条的灵犬,还有其他量化文章的方法吗?

对文章的量化,我研究过一阵子,一篇文章我们可以提取出摘要,关键词,分类到任何一个领域里,还可以计算出文章自身的知识图谱,每一个段落的情感变化等等。有部分的研究成果应用到了GET写作www.getgetai.com,大家可以去寻寻宝。

除了,内容的优胜劣汰机制,我们还要对内容本身进行很好的量化处理,毕竟计算机只认得0跟1。

03

用户自定义推荐引擎

量化歌曲

这是来自Spotify的推荐算法,感谢星球用户阿迪提供的线索。

Spotify通过8个指标,来量化歌曲。并让用户可以自定义这些指标的数值,来达到个性化推荐的目的。

Acousticness

自然程度,用0-1来评估歌曲是否自然

Danceability

舞蹈性,用0-1评估是否适合舞蹈,包括节奏,节奏稳定性,节拍强度和整体韵律。

Energy

活力,用0-1反映歌曲的强度和活力,通常,精力充沛的乐曲感觉快速,响亮。

Instrumentalness

乐器值,用0-1来反映歌曲是否包含人声,乐器值越接近1.0,音轨不包含人声内容的可能性越大。

Liveness

回响度,反映歌曲中是否有观众,越接近1,越有可能是现场录制的歌曲。

Speechiness

脱口秀,反映歌曲中是否存在说出的单词。更独特的语音 - 如录音(例如脱口秀,有声读物,诗歌),属性值越接近1.0。

Tempo

速度,每分钟节拍(BPM)的音轨总体估计速度。在音乐术语中,节奏是给定乐曲的速度或速度,直接来自平均节拍持续时间。

Valence

效价:从0.0到1.0的度量,描述了歌曲传达的音乐正面性。比如高价的听起来更积极(例如,快乐,愉快,欣快),而低价的听起来更消极(例如悲伤,沮丧,愤怒)。

指标非常多,只有对音乐有比较深的认识,和对算法有理解的用户才能很好的适应此套自定义推荐引擎。

04

量化色彩

从无限到有限

在比较早的文章里,介绍过如何量化一张图片的色彩,通过每个像素之间的色彩关系,构造了类似于知识图谱的二元组,从而生成了一个色彩图谱,把色彩之间的规律进行了量化总结。

里面还用到一个技巧,把庞大的色彩范围,映射到了中国色,这个有限的范围里,从而,方便我们理解跟应用

想办法把非常多的指标,化解为普通用户可以接受的有限几个指标,理解成本足够低,才能获得大量的用户认可。

总结

以上是最近的一些思考,总结下:

个性化内容推荐引擎3.0

=

优胜劣汰机制

X

量化内容

X

用户自定义推荐引擎

X

无限到有限的用户体验设计

参考资料:

Spotify推荐算法

https://www.theverge.com/tldr/2018/2/5/16974194/spotify-recommendation-algorithm-playlist-hack-nelson

头条灵犬

https://m.sohu.com/a/227365521_100079876

与作者交流,

可以在知识星球联系shadow

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 自动分配流量池
  • “打怪升级的感觉”
  • 内容质量评估
  • 量化文章
  • 用户自定义推荐引擎
  • 量化歌曲
  • 量化色彩
  • 从无限到有限
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档