近期,谷歌要推出一项“Google News Initiative”的项目,目的是清除线上以及突发新闻状况下的虚假新闻。那么,智能推荐算法是如何筛选假新闻的呢?为什么会存在推荐假新闻的情况?
以某条推荐算法举例:整体算法可以理解为一个函数(给定一个确定的输入,会依据该输入给出特定的输出),这个函数需要输入三个维度的变量。即:
y = F(xi, xu, xc)
其中,F为对应规则。第一个维度是内容(xi)。包括图文、视频、UGC(User Generated Content)小视频、问答内容、微头条等,每项内容有很多自己的特征,需要考虑到怎样提取不同内容类型的特征做好推荐。第二个维度是用户特征(xu)。包括各种兴趣,职业、年龄、性别等,还有很多模型刻画出的隐式用户兴趣等。第三个维度是环境特征(xc)。这是移动互联网时代推荐的特点,用户不可能一直在一个位置做一个固定的工作,在工作场合、通勤、旅游等不同的场景,信息偏好有所改变。
根据这三个输入,会得出特定的输出y,即推测推荐内容在这一场景下对这一用户是否合适。
但是,具体是怎样根据这些特定的输入得出输出的呢?其中就涉及到了智能推荐算法。其智能推荐算法原理可参考问答:“智能推荐算法的原理是什么?”
总的来讲,就是根据你阅读的内容,你特定的用户信息,以及环境因素等因素,通过算法去推荐内容,典型的推荐系统通常由挖掘、召回、排序三部分构成漏斗模型,在理想状态下,经过这三层漏斗的层层过滤,最终经过残酷 PK 留下来的信息应该是比较纯净、优质的信息。一篇新闻从生产到被人消费(阅读)都大致有这么个链条:创作,发布,抓取,分发,点击,阅读。六个环节,是三波人在参与:创作和发布是一拨人,内容生产者;抓取和分发是第二波人,很多都用上了推荐引擎(也就是推荐算法);第三波进行点击和阅读就是内容消费者。现在讨伐的是假新闻被人看到,显然只讨伐中间的推荐引擎是不合适的,当然不讨伐也是不可能的,三波人都脱不了干系。
知道其中的推荐流程,为什么会推荐假新闻的问题就显而易见了。
首先我们要看什么是假新闻:假新闻(Fake news)是刻意以传统新闻媒体或是社会化媒体的形式来传播的错误资讯,目的是了误导大众,带来政治及经济的利益(源自维基百科)。
想必大家都知道发生在2016年的脸书假新闻。在11月9日美国共和党总统候选人唐纳德·特朗普击败民主党总统候选人希拉里·克林顿,当选美国第58届总统。很快,美国各大媒体纷纷刊文,指责脸书(Facebook)上泛滥的假新闻影响了选民判断,认为脸书是帮助特朗普获胜的“帮凶”。
针对“Google News Initiative”项目,Google 表示,“新闻计划”聚焦于实现三大目标——强化优质新闻报道,支持可持续的商业模式,以及通过技术创新向新闻编辑室赋权。此外,该公司还承诺在未来 3 年拿出 3 亿美元资金用于多个跟新闻有关的项目。其中通过Google订阅,读者可以更轻松地支付已同意与该公司合作的新闻机构的内容。该举措主要是为了增加可靠的信息来源。
对于智能推荐算法是如何筛选假新闻这个问题,楼上已经说得很清楚@佛系用户。我在此提一下针对如何减少假新闻的看法:
以上。
忽然想起了2017年度十大假新闻,想看的可以看看:2017年,外国网民最喜欢看的10条假新闻