前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >她来了她来了,乘风破浪的微信视频号推荐算法

她来了她来了,乘风破浪的微信视频号推荐算法

作者头像
炼丹笔记
发布2021-06-15 15:39:03
8010
发布2021-06-15 15:39:03
举报
文章被收录于专栏:炼丹笔记炼丹笔记

作者:DOTA

微信视频号推荐算法大赛

排行榜

问题描述

基于脱敏和采样后的数据信息,对于给定的一定数量到访过微信视频号热门推荐”的用户, 根据这些用户在视频号内的历史n天的行为数据,通过算法在测试集上预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率。本次比赛以多个行为预测结果的加权uAUC值进行评分。

微信视频号推荐数据

(1)Feed信息表

该数据包含了视频(简称为feed)的基本信息和文本、音频、视频等多模态特征:

(2)用户行为表

该数据包含了用户在视频号内一段时间内的历史行为数据(包括停留时长、播放时长和各项互动数据)。

(3)提交结果形式

对测试集中每一行的userid和feedid的七种互动行为的发生概率进行预测,这七种行为包括:查看评论、点赞、点击头像、转发、收藏、评论和关注。

评估指标

采用uAUC作为单个行为预测结果的评估指标,uAUC定义为不同用户下AUC的平均值,计算公式如下:

其中,n为测试集中的有效用户数,有效用户指的是对于某个待预测的行为,过滤掉测试集中全是正样本或全是负样本的用户后剩下的用户。AUCi为第i个有效用户的预测结果的AUC(Area Under Curve)。AUC的定义和计算方法可参考维基百科。

Wide&Deep Baseline

炼丹笔记 参与了本次微信视频号推荐算法大赛。同时,官方也给出基于Wide&Deep的Baseline,具体地址见文末。关于推荐算法我们之前已经讲过很多了,同时也整理过整个CTR预估系列,有兴趣的同学可以翻翻 炼丹笔记 的相关文章。Wide&Deep是其中相对经典的部分。

Baseline运行环境配置

  • pandas>=1.0.5
  • tensorflow>=1.14.0
  • python3

Baseline运行资源配置

  • CPU/GPU均可
  • 最小内存要求
    • 特征/样本生成:3G
    • 模型训练及评估:6G
  • 耗时
    • 测试环境:内存8G,CPU 2.3 GHz 双核Intel Core i5
    • 特征/样本生成:226 s
    • 模型训练及评估:740 s

Baseline模型及特征

  • 模型:Wide & Deep
  • 参数:
    • batch_size: 128
    • emded_dim: 10
    • num_epochs: 1
    • learning_rate: 0.1
  • 特征:
    • dnn 特征: userid, feedid, authorid, bgm_singer_id, bgm_song_id
    • linear 特征:videoplayseconds, device,用户/feed 历史行为次数

模型结果

炼丹笔记的Baseline提交

欲之炼丹笔记所用之模型,且听下回分解....

What You Want

(1)官方Baseline:

https://github.com/WeChat-Big-Data-Challenge-2021/WeChat_Big_Data_Challenge

(2)数据地址:

https://algo.weixin.qq.com/user

(3)Wide&Deep:

https://dl.acm.org/doi/pdf/10.1145/2988450.2988454

(4)炼丹笔记往期文章

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 炼丹笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 排行榜
  • 问题描述
  • 微信视频号推荐数据
  • 评估指标
  • Wide&Deep Baseline
  • 模型结果
  • 炼丹笔记的Baseline提交
  • What You Want
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档