智能推荐算法为什么会推荐假新闻?

  • 回答 (8)
  • 关注 (0)
  • 查看 (144)

近期,谷歌要推出一项“Google News Initiative”的项目,目的是清除线上以及突发新闻状况下的虚假新闻。那么,智能推荐算法是如何筛选假新闻的呢?为什么会存在推荐假新闻的情况?

圣才圣才提问于
佛系用户回答于

以某条推荐算法举例:整体算法可以理解为一个函数(给定一个确定的输入,会依据该输入给出特定的输出),这个函数需要输入三个维度的变量。即:

y = F(xi, xu, xc)

其中,F为对应规则。第一个维度是内容(xi)。包括图文、视频、UGC(User Generated Content)小视频、问答内容、微头条等,每项内容有很多自己的特征,需要考虑到怎样提取不同内容类型的特征做好推荐。第二个维度是用户特征(xu)。包括各种兴趣,职业、年龄、性别等,还有很多模型刻画出的隐式用户兴趣等。第三个维度是环境特征(xc)。这是移动互联网时代推荐的特点,用户不可能一直在一个位置做一个固定的工作,在工作场合、通勤、旅游等不同的场景,信息偏好有所改变。

根据这三个输入,会得出特定的输出y,即推测推荐内容在这一场景下对这一用户是否合适。

但是,具体是怎样根据这些特定的输入得出输出的呢?其中就涉及到了智能推荐算法。其智能推荐算法原理可参考问答:“智能推荐算法的原理是什么?

总的来讲,就是根据你阅读的内容,你特定的用户信息,以及环境因素等因素,通过算法去推荐内容,典型的推荐系统通常由挖掘、召回、排序三部分构成漏斗模型,在理想状态下,经过这三层漏斗的层层过滤,最终经过残酷 PK 留下来的信息应该是比较纯净、优质的信息。一篇新闻从生产到被人消费(阅读)都大致有这么个链条:创作,发布,抓取,分发,点击,阅读。六个环节,是三波人在参与:创作和发布是一拨人,内容生产者;抓取和分发是第二波人,很多都用上了推荐引擎(也就是推荐算法);第三波进行点击和阅读就是内容消费者。现在讨伐的是假新闻被人看到,显然只讨伐中间的推荐引擎是不合适的,当然不讨伐也是不可能的,三波人都脱不了干系。

知道其中的推荐流程,为什么会推荐假新闻的问题就显而易见了。

离岛爱编程,爱画画回答于

首先我们要看什么是假新闻:假新闻(Fake news)是刻意以传统新闻媒体或是社会化媒体的形式来传播的错误资讯,目的是了误导大众,带来政治及经济的利益(源自维基百科)。

想必大家都知道发生在2016年的脸书假新闻。在11月9日美国共和党总统候选人唐纳德·特朗普击败民主党总统候选人希拉里·克林顿,当选美国第58届总统。很快,美国各大媒体纷纷刊文,指责脸书(Facebook)上泛滥的假新闻影响了选民判断,认为脸书是帮助特朗普获胜的“帮凶”。

针对“Google News Initiative”项目,Google 表示,“新闻计划”聚焦于实现三大目标——强化优质新闻报道,支持可持续的商业模式,以及通过技术创新向新闻编辑室赋权。此外,该公司还承诺在未来 3 年拿出 3 亿美元资金用于多个跟新闻有关的项目。其中通过Google订阅,读者可以更轻松地支付已同意与该公司合作的新闻机构的内容。该举措主要是为了增加可靠的信息来源。

对于智能推荐算法是如何筛选假新闻这个问题,楼上已经说得很清楚@佛系用户。我在此提一下针对如何减少假新闻的看法:

  • 源头上,需要保证拥有可靠的信息源。比如谷歌计划订阅服务,让权威媒体获得更丰厚的收入回报,鼓励他们推出优质内容;
  • 后续过程中:除了平台自查,人工干预之外,在技术上,可以尝试做这些事:
  1. 在内容分析上,利用人工筛查的数据做样本,训练一些识别模型,可以把垃圾内容再细分一下,分别训练不同的识别模型,辅助人工做快速筛查;
  2. 在内容抓取上,控制抓取源头的质量,避开垃圾内容的重灾区;
  3. 在推荐分发上,从纯粹的数据驱动转变到数据启示,推荐算法的优化目标从单一目标转到多目标优化,除了考虑效果指标,还考虑内容多样性。
  4. 在用户行为的使用上,也要有所甄别,考虑用户价值。
  5. 在热门内容的使用上,有所甄别和有所克制,采用一些类别的热门内容或者采用某些优质用户圈子的热门内容,而非全局热门内容(参考“YouTube和今日头条很委屈:色情暴力的锅推荐系统该不该背?”)。

图片源自网络

以上。

僅茈侕巳回答于

应该是训练样本的问题,让机器学习,但是训练样本本身就存在问题,或者是特征值不够明显,导致最后的算法出现了问题,分辨假新闻的能力就没有那么强了,所以才会出现假新闻。

方又方回答于

智能推荐算法还是得基于人工智能,基于云计算,推荐使用腾讯云。

温柔的码农Web前端回答于

我觉得即便再智能的算法目前来讲也需要人工进行干预,不然后果真的不堪设想。人工智能还是不能完全代替人工的。

荒烟依旧平楚回答于

利益所驱吧。总有那些人有着不为人知的目的

帕提尼总有一天会成为有些人眼中大神的前端新人~~回答于

快点推出来这个项目吧,假新闻真的害人不浅,也可怜了那些曾经被假新闻坑害过的人。

扫码关注云+社区