糟了!算法说它懂你

来源:知乎

俗语有云:内容平台,能力越大,责任越大。

2018年夏天的《中国好声音》,清华大学的学霸以改编版的《止战之殇》赢得了周杰伦的转身。在问答环节,这位选手特意向大家介绍了歌曲的“合作者”——AI算法。

他说,主体歌词的创作是由AI算法完成的,而他做的事,是“赋予歌词人类的温度”。

这是深度学习算法首次以如此华丽的姿态出现在综艺节目上,像是AI在向世界宣告自己的“霸主”地位。事实上,它对我们生活的渗透早在多年前已经开始。

算法勾魂术

2000年,国内互联网时代正式开启。智能算法随着互联网对生活的渗透,也开始进入到各个公司的产品设计中。这种算法从早期的打标签方式开始,强调对用户的“内在个性”的关注,使用户在产品体验过程中释放诉求,进入到特别推荐、社区等被算法充分了解的领域,进一步提升了用户的黏性。

对早期用户而言,这样的算法,是充满新鲜感又刺激的。

文娱领域通过算法实现个性化推荐功能的开山鼻祖,当属于2005年成立的豆瓣。早期,它基于用户社交属性,即人群喜好的重合度因素,利用算法进行分类与关联推荐,实现对书籍、音乐和电影内容的个性化推荐。当时的豆瓣还是社区模式,针对的也是有固定特性的垂直用户,这样的算法非常巧妙地在形成了口碑效应,在短期内用户量急速增长,成为了当时的“流量”大平台。这种由算法带来的超强用户黏性使得在未来十年中,即便豆瓣几经飘摇,也依然有其影响力的重要原因。

令人惋惜的是,虽然如今的豆瓣电影被看成中国的IMDB,但是就整个平台而言,由于十年间计算机覆盖率呈指数级增长,用户覆盖到社会各个角落,广告、不良内容的逐渐渗入,豆瓣曾经引以为傲的算法带动优质内容的初衷也不再存在。同时2010年以后,知乎、网易云音乐等内容平台的出现,借助更加优质的AI智能算法迅速吸粉,瓜分了豆瓣原有的用户阵地。

然而无论是曾经的豆瓣社区,还是现在号称智能算法的各大内容平台,推荐同质化严重的同时,也让人质疑,这些算法开始不懂用户了。

智能算法到底是什么

当下AI推荐机制下催生的内容平台大致可分为四类,分别是以今日头条为代表的新闻内容平台,以知乎为代表的知识问答平台,以抖音、快手为代表的短视频平台和以网易云音乐为代表的流媒体音乐平台。

尽管应用领域有所不同,各款产品的特性和生态布局也有差异,但是在个性化推荐机制的设计上,万变不离其宗,它们的心思如出一辙。

总体来看,AI推荐机制的框架设计基于三个维度。

第一个维度是内容,即基于音视频或文本本身的内容提取标签并以此分类。如在音乐领域,可依据音频中的频率、歌曲名、歌手、音乐风格特征等信息来将内容归类为布鲁斯、蓝调或者摇滚等; 第二个维度是用户,即对用户行为数据进行提取和分析。如在各大平台上,都会见到喜欢、收藏等选项,这里面,用户的操作会折合成一定的权重,并影响最终的算法结果; 第三个维度是场景,这其中包括了时间场景和环境场景。在不同的环境和时间段,同一用户的选择趋向也是不同的。

事实上,算法框架衍进至今,是一步一步完善至此的。内容和用户维度先后出现,最后才是场景,它们三者之间互为牵制和补充,从而避免推荐结果出现偏颇。

单纯基于内容的算法有着明显的问题,因其分析的是大量的数据,算法自然无法推荐新的和非主流的内容,易使推荐趋同。因而,对用户行为的分析,自然就可以利用用户对内容的态度来有效判断新内容的质量,并借助用户的差异化来使得算法推荐保持一种持续更新的状态,这样就弥补了内容算法的局限性。同时,这一维度的直接好处就是,帮助平台快速得获得用户的喜好信息。而场景的融入,则帮助算法更加精准的把握用户选择的变化规律,以实现人性化。

这里面,内容与用户行为两项维度占主导因素,前者受限历史数据,后者受制于用户行为。而两者融合,则相得益彰。

人工管理与AI算法之间的博弈

今天,将推荐机制用到极致的平台中,不得不提今日头条。它通过将用户分享和AI智能推荐机制很好的融合在一起,并以此“上位”。而随着影响力的扩大,今日头条的算法推荐漏洞亦于无形中被放大,终被推上了风口浪尖。

但是历经四次改版的今日头条算法依然有着AI无可避免的通病,包括对语境的判断、对边界性信息的筛选等,也因此虽然它在海量信息中为用户做出了选择,但这样的选择缺乏用户意愿的反馈,缺乏词义多重理解带来的有效信息判断,可能用户在某一时刻看了一篇具备反讽意味的文章,通篇采用了魔幻主义写作手法,而算法就会基于这样的无差别判断,持续不断地为他推送与其意愿不符的内容,而忽略了其真正想要获得信息。

在这个层面上,算法的存在,不但没有真的懂用户,反而在更广的范围内,试图以技术的途径承担媒体的职责,却忽略了媒体社会价值的根本在于信息的全面性、观点的多样性,而不是重复在某一个舒适的维度。

在过去将算法设为主要运行机制,人工为辅助,今日头条平台的运行成本确实得到大幅的降低,商业利益得以最大化,但也因此凸显了弊端。当然,今日头条也在通过建立“青云计划”等机制,广招审核员去试图扭转内容的走势,但正如其资深算法架构师曹欢欢博士所言,“平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预” 。

事实上,完全驱除人工管理根本是个伪命题。任何一种算法都是基于平台价值与利益而产生的,它代表的也是平台管理者的价值观。在某种程度上,算法可以不动声色地让你充分了解这个平台的气质、个性甚至是追求。

而关于二者之间的对峙,则有个经典的故事。自2015年开始,因立场不一,老牌流媒体音乐服务平台Spotify与Apple Music之间就一直处于对峙状态。作为坐拥7500万用户的音乐服务平台,Spotufy坚持用大量的数据进行个性化推荐,而人工挑选和推荐音乐一直是Apple Music的重要卖点。库克认为,“我们担心音乐正在失去人性,担心它正在变成一个字节一样的世界,而不再是一个艺术和技艺的世界”。

然而,从目前的统计数据来看,位居第一的Spotify的用户数是Apple Music(第二位)的两倍,却是不争的事实。

智能反被智能误

你并不懂我

而用户,没有纠结,简单直接。

作为资深音乐爱好者和网易用户,小乙对平台主打的智能推荐其实存有不满,“网易云音乐会给我推荐不同的歌单,但我只会偶尔点开,而且点开后我大致‘看’了一下,发现基本不是我想要的,它也并不懂我,很少能触碰到我的点。”

对于今日头条头条的推荐机制,小甲也有类似的感受,“我只是有那么一次点开了娱乐新闻,结果平台就狂推娱乐八卦给我,看不到我想看的,我非常反感。”

这不是算法引发的个例。如上文所言,算法在某种程度上试图承担媒体的介质作用,它当然也可以从设计上,通过融入用户和场景两项因素弥补单纯基于内容分析带来的信息同质化问题,但是,算法的设计未考虑理想与现实之间的差距因素。

受用户群体素养、不同领域用户行为、人性原始欲望等因素影响,长久下来,平台推荐的内容自然就会渐渐养成为是偏于大众趣味的。驯化后的平台带来不了阅读惯性之外的信息,无法增加技术的新鲜感,同时也“刻意”地流失了很多优质内容。优质内容的参与度低,算法的正向反馈会在无形中被削弱,而这也将极大地削弱内容创作者的动力和创新性。

当下,虽然各大平台一直在通过资本运作等措施去阻止“个性化推荐”剑走偏锋,但事实是,大众文化的力量终还是把平台的“棱角”抹平,成为了一个吸引新用户和“懒人”的聚集地。

最后

在互联网时代,碎片化信息无可避免成为了主流,在这样的境况下形成有效的认知与思想体系不是一件简单的事。AI算法也毋庸置疑,是当今各个平台的主流技术手段,然而其弊端和优势一样,都在朝相反的方向撕扯平台的核心价值和用户。

内容型平台最重要的作用不见得是信息的聚拢,更多的应该是引导,广泛的、多维度的、有温度有思想的内容引导。这显然不是单纯的算法一统天下能够达成的,也不是加入人工干预就能周全的。

AI算法是天然趋势,它懂用户的前提是,尊重用户。

原文发布于微信公众号 - 镁客网(im2maker)

原文发表时间:2018-08-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

应用 | 红黄蓝的虐童惨案,其实可以用机器学习等技术来避免

作者 | 阿萨姆 魔都携程亲子园事件还未平息,帝都的RYB“虐童案”又粉墨登场。随着越来越多的有关婴幼儿教育的丑闻曝光,如何保障孩子,尤其是幼龄儿童的生命健康安...

35811
来自专栏大数据钻研

代码的终结,我们很快就能像调教狗一样来调教我们的计算机

在发明计算机之前,大部分的实验心理学家都认为大脑是一个不可知的黑盒子。你可以分析一个实验对象的行为,例如,一旦听到铃铛想起,狗便会分泌唾液。但是思想、记忆和情绪...

3018
来自专栏机器人网

真正能和人交流的机器人离我们有多远?

《经济学人》近日刊登文章,称计算机在翻译、语音识别和语音合成上都获得了很大的进步,但它们仍然不了解语言的含义。以下是原文内容: “对不起,戴夫,恐怕我不能这样做...

2243
来自专栏数据猿

数尊CEO许正:大数据在金融风控领域的思考与探索

数据猿导读 当前传统信贷业务模式可归结为两类:资金驱动模式和场景驱动模式。而这两类模式现在必须要向第三类模式转型,也就是技术驱动模式。 ? 作者 | 许正 我是...

3475
来自专栏AI科技评论

业界 | 计算芯片革命来临?英伟达谷歌入局紧逼英特尔

AI 科技评论按:随着神经网络的研究和应用越来越多,人们也越发地认识到神经网络所需的计算力近乎于无底洞 。如果说高校实验室和一般爱好者在耐心等待之外办法不多的话...

35510
来自专栏PPV课数据科学社区

数据分析经典语录

【数据分析三字经】①学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新; ②方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动...

4386
来自专栏大数据文摘

惊艳!Facebook未来十年愿景!

27910
来自专栏风火数据

如何设计淘宝天猫这种成功而有价值的大数据可视化

塔夫特所说,“图形表现数据。实际上比传统的统计分析法更加精确和有启发性。”对于广大的编辑、设计师、运营分析师、大数据研究者等等都需要从不同维度、不同层面、不同粒...

1722
来自专栏腾讯大讲堂的专栏

干货 | 滴滴出行大区运营经理:滴滴的城市运营方法论

讲师介绍:刘武新,滴滴出行出租车事业部广州大区运营经理,曾经就职为顺丰速运集团,中国移动,中兴软创科技等公司的数据分析师、项目经理、运营经理等岗位,6+年以上数...

1.4K7
来自专栏大数据文摘

CES 2017 | Nvidia黄仁勋领衔:从云上的游戏电脑 到与奥迪合作真正AI车(完整视频)

1673

扫码关注云+社区

领取腾讯云代金券