从9月18日到20日,连着三天,人民网每天一文,三评智能算法,矛头直指今日头条——一个依靠数据挖掘推荐引擎的内容分发平台。
显然,人民网此次是“怒”了。而做为矛盾中心,今日头条到底做了什么,才会引来如此“关注”?
人民网认为,智能算法作为新技术,在加入内容分发平台后,犯下了“三罪”:
1.垃圾新闻过多; 2.私人订制信息易造成用户自我封闭; 3.促使内容生产者媚俗化并削弱其创造力。
但镁客君想说,在这连番的指责中,智能算法并没有原罪。
从人民网的三评中可以看出,智能算法的不完善导致了众多不良社会影响。但这真的是智能算法的错吗?
抛开今日头条,人工智能算法在其他领域的应用效果是有目共睹的。
当前,淘宝等线上电商平台对智能算法均有应用。该算法会依据用户的浏览和消费行为为用户推荐相关产品。而在线下大数据服务方面,如ZMT这样的服务平台也会通过智能算法分析数据并为客户提供广告、促销建议等。而用户对此的接受度也是很高的。
镁客君认为,技术没有原罪,只是在与内容平台的结合中,暴露了其缺陷。
真正好的智能算法,应该是可以根据用户的喜好数据,对内容进行审核并分析用户实际心理,以做到一个内容分发平台应该做的事。
可以预见的是,如果今日头条与智能算法能够完美融合,那么它就不会只知道推荐“同样”的内容,垃圾新闻也不会出现在用户的首页。
用过今日头条的人应该都知道,在你第一次它的某条新闻之后,你的首页就会被该类新闻或相关、相近的新闻所填满,简称个性化推荐。不可否认,今日头条之所以在很短时间内打出知名度并获得大量用户认可,智能算法推荐是其最大的功臣,没有之一。
从今日头条推荐的结果看,其智能算法大致走了以下几大流程:
一、数据抓取。如果用户在注册时用的是微博等既有账号,今日头条就会从该账号的日常动态中抓取数据。而如果用户没有用此类账号注册今日头条或者这些账号并无动态,智能算法则抓取用户前几次的信息浏览数据。
二、用户分析。每个用户都是一个数据库,随着用户信息浏览行为的增多,其数据库中的数据也就越来越多。智能算法会对这些数据进行整合与分析,从而提炼出该数据库的关键词。
而当前智能算法在这方面的欠缺就是,太过依赖数据库既有数据,无法举一反三。此外,每一个数据库除了最初的数据是能真实反映用户心理之外,随后填充进去的数据都是基于用户被推荐后的浏览行为所产生的,数据相似度太高。
三、内容审核。可以说,这是智能算法被抨击的关键问题所在。在这方面,智能算法主要做了两件事,消重和审核。
可以看到,在今日头条推荐给用户的内容中,是没有重复的内容的,这是因为智能算法有消重这一功能。但同时,目前今日头条所推荐给用户的部分内容的相似度还是比较高的,包括标题、图片以及文章的具体内容等。
而审核方面,今日头条几乎完全依赖于智能算法,这也导致了在算法不够完善的情况下,无法准确审核出“不适合”的内容,从而阻止低俗内容。这是智能算法“最大的罪过”。
四、新闻推荐。这是最后一步,也是与用户直接关联的一步。从今日头条的推荐机制看,文章的标题与内容若与热点挂钩,则会在推荐的最初就得到“关照”。而如果文章的点击量越高,其推荐的次数就会越多。这是智能算法对文章受欢迎程度的直接判断。
因此,很多作者为了阅读量推荐量不惜做标题党,一味的蹭热点博关注。这不仅促使作者媚俗化,还降低了内容的整体质量。
然而,人民网在三评智能算法中,是从社会影响角度去分析今日头条等的给用户带去的不良影响的。既然从技术层面看,智能算法推荐技术并无原罪。那么,所需要反思的就是平台管理者和部分“爱看低俗内容”的用户了。
仅从智能算法这一技术上说,它为用户提供的关键性服务就是记录喜好并分析喜好,最后做出推荐。简单来说,今日头条的智能算法就是在用户浏览信息时智能抓取了关键词,并自动根据关键词匹配出相关内容,最后将这些内容推荐给用户。
那么,镁客君想问一句,如果你最初没有浏览低俗内容,平台又怎么会继续为你推荐这些内容呢?此外,平台应该对用户负责,如上面所说,既然当前技术审核能力有限,平台管理者的审核能力就必须要跟上。
而至于“促使内容生产者媚俗化并削弱其创造力”,虽然推荐机制是诱导这一问题出现的原因,但内容产生者因有其原则与判断。一味跟风,有失“作者”之责。
最后,我们现在还处于弱人工智能时代,技术有智商,但没有情商。我们不能要求技术了解用户的心理,在“私人订制信息易造成用户自我封闭”的问题上,还需要用户与平台一起主动走出封闭空间,去了解更多的内容。
新技术的出现必有其缺陷,我们不否认问题,但也不夸大问题。在弱人工智能时代,我们所要做的不是抨击,不是打压,而是找出问题所在,而是在加快技术发展进程的同时让其应用到更多的领域中去。