前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >反大数据反算法,“反”的究竟是什么?丨科技云·视角

反大数据反算法,“反”的究竟是什么?丨科技云·视角

作者头像
科技云报道
发布于 2022-04-14 10:42:52
发布于 2022-04-14 10:42:52
5730
举报
文章被收录于专栏:科技云报道科技云报道

企业都想借大数据技术浪潮,反大数据和算法的公司、社交平台却掀起一阵小波澜,是大数据出了问题吗?

大部分应用都希望运用大数据和算法,推出个性推荐等功能,希望尽可能长的留住用户时间。

然而,国外反算法的社交网站Are.na月增长率能高达20%,“旅游青蛙”给你一只不知道什么时候回家的青蛙,看似无法长时间吸引用户却独在国内爆红,国内外用户的反常举动背后原因值得深思。

谁在“反”大数据

全世界都不想错过大数据带来的技术变革,大量企业都希望通过大数据搅动市场,占据市场先机。意外的是,反大数据、反算法的企业也开始获得发展机会,得到资本市场的认可,大数据堪称“双刃剑”。

以色列特拉维夫的网络安全技术公司 D- ID ,可能是目前第一家反图片识别技术的公司,可以生成算法无法辨识的照片和视频,但同时保持与真实人脸相似,以保障个人隐私及身份信息不被面部识别技术恶意读取。

其目标是保护已经被用于身份认证的数据,同时确保数据不会在一开始就被“读取”。依靠这套以算法反击图片识别算法的技术,达到了反击常规“算法”的效果,此前宣布刚获得 400 万美元种子轮融资。

相比较而言,社交和研究网站Are.na反算法更加彻底。既没有广告,也没有算法追踪,在该网站上收藏的内容与流行度无关,也没有点赞的按钮。这一套与Facebook和Twitter相反的反社交玩法,虽然总用量不高,但月增长率达20%。

事实上,国内社交媒体也有类似的算法功能给用户带来困扰。微博上为用户准备了当天的热搜话题,各大新闻客户端的算法把最热门事件的关键词作为推荐内容,用户要么被不同标题但内容几乎相同的消息困扰,要么被名不副实的标题党文章困扰。

可以看出,大数据和算法的应用,由于没有明确的边界,给用户带来的不一定都是便利。大数据和算法将很多此前独立存在的内容连接在一起,不断加强的中心化趋势带来的困扰也影响国内用户。

虽然国内还没有类似网站和技术出现,但是最近只在国内爆红的“旅行青蛙”,可以看出一些趋势。

目前谁都说不明白该游戏火爆的原因,不过在一个天气预报APP都要集成新闻、社交功能的中心化趋势下,这款游戏不集成其他功能留住用户时间,反而做到“用完即走,但走了还要回来”的效果,背后用户心理确实值得关注。

个性推荐不符大数据“超能力”

目前,大数据和算法的应用还将是主流,能给普通人生活带来变革。然而,值得注意的是,每一个新技术的发展,应用不当也会带来不利影响,必然会产生不同的声音和需求。

反大数据、反算法和反社交现象的出现,用户更多不是反对新技术,而是对新技术应用不足的不满。

至于大数据当前的应用,首当其冲的问题是大数据“太蠢”。

例如用户在电商网站搜索或购买过一款产品后,再打开网页,发现广告位都是之前购买过的产品推荐,这是大多数用户都遇到过的情况。

在以个性推荐为特点的应用中,也存在这样的问题。作为某音乐APP的用户,曾经因为制作视频,搜索并收藏了几首纯音乐,后来个性推荐大部分都是纯音乐。身边有朋友因为某天心情变化,集中听了几首摇滚风格音乐,发现未来就会不断推送同风格音乐。

想变换风格,需要刻意点赞、收藏几首其他风格歌曲,才能让推荐更加均衡。这些都是大数据当前应用的不足,没有带来便利,个性推荐功能偏离了最初设定的路线,变成了用户的养成游戏。

大数据应用在个性推荐上的“跑偏”,还体现在新闻客户端和社交媒体上。在信息过载的当下,面对大量信息,用户的选择会倾向自己感兴趣的内容,或者说是满足个人欲望的内容,基于此的个性推荐会不断放大欲望,娱乐八卦占据热搜就是例子,这并不是一个好的应用。

此外,大数据技术应用还存在边界问题。如何判断一些数据互联是必要,哪一些是过度互联,是下一步需要考虑的问题。

网络使人类的连接更加紧密、方便,但过度连接会加快信息的传播速度,使人类社会变得更加脆弱。

依托大数据实现物联网进一步扩大了连接的数据量,安全、隐私等问题变得不可控,一个局部的小问题也容易转变为大规模的问题。

反大数据和反算法的出现是一个提醒。我们面对大数据技术,就像是刚刚获得超能力的超级英雄,不知道这个能力究竟有多大威力,不清楚不同情况该使用多少超能力。在应用过程中,会有惊喜,也会有好心办坏事,必须要谨记能力越大,责任越大。

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-02-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技云报到 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
推荐系统正成为所有领域的一种标配
近段时间团队在扩建算法小组,首当其冲的岗位就是推荐算法工程师,然而历经一、两个月的招聘后,却发现一个事实,推荐算法工程师太难招了。
CSDN技术头条
2018/08/17
3380
推荐系统正成为所有领域的一种标配
【大数据毕设】基于Hadoop的音乐推荐系统论文(三)
本文基于Hadoop技术,设计并实现了一个名为“酷酷音乐网站”的系统,用于音乐资源的存储、管理和推荐。该系统采用Hadoop生态系统中的组件,包括HDFS、MapReduce、HBase和Mahout等,实现了音乐数据的采集、存储和管理,用户行为数据的分析和建模,以及音乐推荐功能的实现。具体而言,该系统使用HBase存储音乐数据和用户行为数据,使用Mahout构建了推荐模型,并将其部署到Hadoop集群上。同时,为了方便用户的使用,该系统实现了一个基于Web的用户交互界面,允许用户搜索音乐、查看推荐结果等。最后,本文对该系统进行了性能测试和评估,结果表明,该系统能够高效地管理音乐数据、准确地推荐音乐,满足了用户的需求。本文的研究对于理解Hadoop技术在音乐推荐系统中的应用具有一定的参考价值。
Maynor
2023/09/10
2K1
【大数据毕设】基于Hadoop的音乐推荐系统论文(三)
干货丨你们要的教育大数据产品都在这里
导读 教育改革进入“深水区”后,破解教育领域深层次矛盾的难度加大,利用教育大数据助力教育改革与发展正变得越来越重要。 大数据时代,各个企业都希望争取更大的蛋糕,纷纷搬
钱塘数据
2018/03/01
1.4K0
干货丨你们要的教育大数据产品都在这里
无人超市只是小把戏 ,他们要把整个城市“智能化”丨科技云·视角
无人超市的刷屏,AWS技术峰会的爆满,令人们深切体会到云计算正让智能时代加速来临。紧随其后,一场有关智能交通的变革正在酝酿之中,或将颠覆有车一族的出行体验。
科技云报道
2022/04/14
3500
大数据挖掘技术在企业创新中的应用(下篇)
4、应用、方式和收益 4.1数据统计是大数据的最直接应用 数据统计是大数据应用的最直观的形式,数据统计在企业中常被称为商业智能(BI, Business Intelligence)系统,使用者们通过观
达观数据
2018/03/30
1.4K0
大数据挖掘技术在企业创新中的应用(下篇)
阿里巴巴大数据之路读书笔记——用户画像的定义
用户画像在阿里巴巴旗下的淘宝网、虾米音乐上都不乏个性化推荐场景,淘宝、天猫平台上的众多商家则需要通过用户调研和产品研发来把握产品的目标人群和人群偏好,从而对用户投其所好。对用户有深刻的理解是网站推荐、企业经营制胜的重要 环。在传统企业中,获取用户的反馈信息耗时长、结果缺失,是个难关。然而 随着大数据热潮的兴起,快速捕捉海量用户行为并精确分析人群偏好等商业信息已经成为可能。作为个性化技术的重要基础,相比于传统企业的购物篮分析、问卷调查,在用户 画像的塑造上具备技术的天然优势。 阿里全域数据提供了足够的数据基础,正是基于用户网购、搜索 娱乐影音等行为的数据洞察,可以利用数据分析辅以算法的视角对用户进行 360 全方位的特征刻画。那么,究竟什么是用户画像?通俗地讲,用户画像即是为用户打上各种各样的标签,如年龄、性别、职业、商品牌偏好、商品类别偏好等。这些标签的数目越丰 ,标签越细化,对用户的刻画就越精准。例如,分析某用户为女性,可能仅仅是将与女相关的服装、个人护理等商品作为推荐结果反馈给该用 户:但若根据用户以往的浏览、交易等行为挖掘出进一步的信息,如用户的地理信息 海南,买过某几类品牌的服装,则可以将薄款的、品牌风格相似的服装 作为推荐结果。一般而言,用户画像可以分为基础属性、购物偏好、 社交关系、财富属性等几大类。对于刻画淘宝网购用户,则应侧重于他们在网购上的行为偏好。下面以用户女装风格偏好为例,讲解该用户标签是如何基于全域数据产出的。购买过淘宝商品的读者对商品详情页都不会陌生,一件商品的关键 特征除了反映在商品图片和详情页中以外,主要可以采集的信息是商品的标题以及参数描述。女装有哪些风格?首先需要将女装行业下的商品标题文本提取出来,对其进行分词,得到庞大的女装描绘词库。然而,淘宝商品的标题由卖家个人撰写,并不能保证其中的词语都与商品风格描述相关。因此,对于所得到的女装描绘词库,首先,需要根据词语权重去除无效的停用词,方法如计算 TF-IDF 值。其次,在女装商品的参数描述中,如果已经包含了一种商品风格,例如“通勤”“韩版”等常见风格,那么通过计算词库中词语与参数描述中风格词的相似度,可以过滤得到女装风格词库,利用无监督机器学习如 LDA 等方法可以计算种风格所包含的词汇及这些词汇的重要性。那么 买家偏好什么风格昵?在淘宝网上,买家拥有浏览、搜索、点击、收藏、加购物车以交易等多种行为,针对每种行为赋予不同的行为强度(比如浏览行为强度弱于交易行为),再考虑该商品的风格元素组成,就能够通过合理的方式获知买家对该风格的偏好程度了。对于这样的商品偏好计算,数据挖掘人员需要仔细分析用户偏好的商品的类型、品牌、风格元素、下单时间,这 系列行为可以构成复杂的行为模块。同理,利用机器学习算法,可以从用 户行为中推测其身份,例如男生和女生、老年与青年偏好的商品和行为方式存在 别,根据定的用户标记,最后能够预测出用户的基础身份信息。
Maynor
2021/12/07
5620
两会提案呼吁大数据立法,跑偏的大数据要回归正轨丨科技云·视角
两会上,与科技相关的提案关注度不断攀升。其中,大数据技术正被广泛应用,遇到更多问题,对政策、立法的推进需求更加迫切。
科技云报道
2022/04/14
5780
大数据杀熟如何破?技术、监管和模式三管齐下
最近某在线旅行预订平台,被网友曝出“大数据杀熟”的消息。尽管这家在线旅行预订平台第一时间澄清是“系统bug”,但却依然难以让网友们对自己的钱包放心,毕竟,“大数据杀熟”事件已经多次出现,而手段更是层出不穷。
罗超频道
2019/04/30
6720
大数据杀熟如何破?技术、监管和模式三管齐下
用大数据重塑客户关系管理:聪明企业的秘密武器
在当今竞争激烈的市场中,企业如何吸引并留住客户?客户关系管理(CRM)是其中的核心。然而,传统的CRM方式已无法满足不断变化的客户需求。幸运的是,大数据技术的崛起为CRM提供了新的动力,使企业能够更精准地理解客户、预测需求,并制定更具针对性的策略。
Echo_Wish
2025/04/11
1300
用大数据重塑客户关系管理:聪明企业的秘密武器
hadoop大数据典型应用,基于Hadoop技术的大数据应用解决方案,湖北大数据平台,数道云
近年来,Hadoop技术,大数据研发产品在国内迅猛发展,其在不断的发展中解决了传统数据库无法胜任海量数据处理的问题,以及结构化和非结构化数据统一起来进行数据分析、建模和挖掘得到了更高效的处理方案。这一切都归因于Hadoop的开源工具,依靠其自身优势实现对大容量数据计算存储。
数道云大数据
2019/05/15
7630
大数据市场正从基础投入迈向应用
作为当今企业信息化领域最热门的话题,大数据掀起了新一波IT投资和信息化建设的浪潮。无论是在大数据发源的互联网和电子商务领域,还是在金融、零售、制造、物流等线下业务领域,越来越多的中国企业开始思考、探索和尝试应用大数据的技术和手段,来提升营销、运营和生产的效率及效能。  个性化信息成大数据营销法宝   瞄准大数据时代带来的巨大市场机遇和广阔前景,百分点公司定位于第三方大数据技术和应用服务提供商。百分点创始人兼董事长苏萌告诉《经济参考报》记者,“数据在未来是商业里面最核心的价值,我们做的所有的事都是
腾讯研究院
2018/01/31
5990
基于大数据的线上线下电商用户数据挖掘研究
Online-to-Offline( 简称 O2O) 电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式。 O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道; 线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付,再到实体店完成余下消费。 它最先由 TrialPay 创始人 AlexRampell提出,在 2006 年沃尔玛公司的 B2C 战略中予以应用,随后以网络团购形式为大家所熟知。 目前 O2O电子商务与社交网络和移动终端紧密结合
小莹莹
2018/04/20
1.1K0
基于大数据的线上线下电商用户数据挖掘研究
【推荐】大数据究竟是什么?一篇文章让你认识并读懂大数据
在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术、新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来。究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“土鳖”;二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然。   我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆积起来形
机器学习AI算法工程
2018/03/09
8260
大数据工程师飞林沙的年终总结&算法数据的思考
从前东家离职已经一个多月的时间了,在这一个月,前前后后也和几家公司做了技术交流,自己也第一次静下来这么久来思考总结。今年是我毕业的第五年,也正巧赶上年底,就把这些凑到一起写个小总结吧,也没有什么主题,没有主次,纯粹记录,想到哪儿写到哪儿。 1. 推荐系统 在最近的三四年时间里,我的主要工作就是搭建推荐系统,这几年来不说看了上千篇论文也有数百篇了,这种专注让我自认为在推荐系统领域至少处在一个业界相对领先的水准,但是也恰恰是这段经历让我被打上了深深的标签:他是一个“推荐系统专家”。既然这样,那我就先来说说推荐系
机器学习AI算法工程
2018/03/09
1.4K0
大数据工程师飞林沙的年终总结&算法数据的思考
小程序的智能推荐与大数据应用
智能推荐 是利用算法和模型,通过分析用户的历史行为、兴趣偏好等数据,预测并推荐最符合用户需求的内容或商品。在小程序中,智能推荐常见的应用场景包括商品推荐、内容推荐、社交推荐等。
LucianaiB
2025/02/10
2050
“算计”vs“反算计”?年轻人让算法走出玄学、为我所用
App能通过手机麦克风偷听用户谈话内容,筛选关键词后再推荐商品到常用的应用里?感觉太玄了。
镁客网
2019/04/26
3950
“算计”vs“反算计”?年轻人让算法走出玄学、为我所用
新闻客户端就这样吃上大数据
近日网易新闻客户端在广州发布了“解码城市态度”数据报告,基于大数据挖掘,从文化、商业、生活等五个维度给大家呈现了广州这座城市。这一活动还将陆续在青岛、成都、上海等城市开展。在此之前,今日头条客户端也做
罗超频道
2018/04/28
5630
新闻客户端就这样吃上大数据
达观数据:发掘大数据时代下的媒体潜能
马云说:互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。近两年,“大数据”这个词不断涌入大众的耳海,面对大数据,许多人都一头雾水。它貌似有着高不可攀的地位,却早已无声无息的融入我们生活的方方面面。前段时间热门事件“小李子莱昂纳多结束22年的悲情陪跑,“冲奥”成功,登顶奥斯卡影帝”获得媒体的争相报道。但比这一事件更受大众关注的则是在颁奖典礼到来之前,国外媒体以及大数据分析平台就已经纷纷进行奥斯卡预测,某知名人工智能预测公司依靠大数据命中奥斯卡三项大奖,大数据的预测能力无疑成为这
达观数据
2018/03/30
7840
盘点丨10大天然大数据公司,看他们如何挖掘数据价值
1、亚马逊的“信息公司” 亚马逊要处理海量数据,交易数据的直接价值很大。作为一家“信息公司”,亚马逊从每个用户的购买行为中获取信息,将用户在网站上的行为记录下来,页面停留时间、用户查看评论、搜索关键词、浏览商品等。亚马逊对数据价值的敏感和重视及挖掘能力,使它远超传统运营方式。 2、谷歌“意图” 准确定义“大数据”概念的科技公司非谷歌莫属。根据搜索研究机构的数据,仅1个月的时间,谷歌处理的搜索词条数量就高达122亿条。谷歌的体量和规模,使它拥有比其他大多数企业更多的应用途径。 谷歌不仅存储了搜索结
钱塘数据
2018/03/01
1K0
盘点丨10大天然大数据公司,看他们如何挖掘数据价值
达观数据科技助力电商在大数据的海洋里破浪前行
曾经有一个笑话“隔着互联网,没有人知道对面是不是一条狗。”如今再看这个笑话却已是有几分老古董的味道,互联网不再是蒙住人们双眼的纱布,反而透过这个介质我们的生活习惯,兴趣偏好等等都会展露无遗。可以说,“隔着互联网,所有人都知道对面是条哈士奇。”这意味着随着信息技术的发展,数字化的虚拟世界逐步和现实世界进一步融合,虚拟世界的影响力会不断地渗透到现实,这样的未来有点像电影《黑客帝国》的场景,每个人都是由0,1这两个数字拟合的具象物,不论我们在网络上每一次购买,收藏,评论,还是在小说网站的搜索,放入书架都会在我们的
达观数据
2018/03/30
8860
推荐阅读
相关推荐
推荐系统正成为所有领域的一种标配
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档