【独家专访】Zoom Social-大数据告诉你谁会上头条

【大数据文摘-原点栏目】

“原点”坐标中的定位点、起点,万事开头难,但只要起步,一切皆有可能。2015年初, 大数据文摘“原点”栏目成立。这是针对大数据初创公司的采访栏目。通过在线采访的方式,对与大数据相关的初创团队进行采访,介绍项目、技术、商业模式。初期,我们的采访对象是美国等发达国家的大数据相关的初创企业,他们一般已经获得天使或A轮投资。 我们希望通过“原点”,为读者打开一扇门,看到国外“大数据”初创公司是如何启动、运营的,看到这些创业公司后面的人、团队有着怎样一种情怀。同时我们也会真诚帮助那些愿意在“大数据文摘”平台接受采访、分享创业经验的企业。只要你的公司有价值,愿意与读者分享。我们就愿意免费采访您。 大数据文摘从2013年7月成立至今,每日坚持分享优质文章,从未间断。已有读者超过13万,是微信上最有影响力的大数据自媒体。原点栏目组由在北美各大应用领域(医疗,电商,咨询等)从事与大数据相关工作的具有高学历及数据专业背景的成员组成。 我们欢迎更多乐于分享的创业公司与我们邮件联系,邮件中请附上您的公司简介及相关诉求,邮件发送至origin@bigdatadigest.cn

【本期嘉宾】

【导读】:谁该上头条?如何从成千上万条信息中准确定位最有价值的热点?这是个不仅让汪峰关心,也让所有媒体编辑头疼的问题。本期创业人物杨绍峰用他的创业公司Zoom Social,给这个难题提供了一个基于大数据运算的科学解答。大数据文摘原点栏目组本期与Zoom Social 的创始人– 杨绍峰交流,并跟大家分享他的创业故事以及Zoom Social的成长历程。

奥斯丁的意外发现

在奥斯丁小城一所酒吧里看到“twitter最热照片墙”的时候,杨绍峰有了新的发现。当时的他刚刚意识到自己研发了近三年的实时地点定位和预测产品并不容易推广,这片照片墙让他感到,自己的产品在社交媒体这个崭新的领域应该会有更好的应用。

杨绍峰此时正身处全球最大音乐、电影和媒体互动盛典SXSW(South by Southwest)现场,在一个完全陌生的城市,他跟所有初来咋到的探索者一样,急切的想要了解这个城市最热的话题:哪个酒吧有最酷炫的爬梯,哪个广场有最Pop的摇滚歌手献唱,哪个会场有最精彩的讲演。小酒吧的照片墙让他意识到,Twitter这样的社交媒体中的热点话题能够引导人们找到这些问题的最佳答案。

自媒体时代,人人都是记者,像Twitter,Facebook这样的社交媒体更成为了巨大的信息集散地。社交媒体信息的发布基于时间、地点,像一片巨大的网络,能够实现传统媒体无法想像的及时更新。但是,如何从这片网络中准确捕捉到最多人关注的热点信息?杨绍峰决定利用自己一直研究的数据存储和实时定位技术解决这个问题,为这些“大众记者”提供一个崭新的平台。

杨绍峰进一步思考,每个人的社交软件可以更新诸多地理方位,如果能知道周边的实时情况,进行数据分析,就可以了解人们的兴趣点在哪里。过去的Internet时代可以从Cookie中获取用户的兴趣爱好,从而推送有针对性的广告。到了App时代,兴趣爱好就可以从公开的社交信息中推测出来。于是,杨绍峰决定做一款类似社交地图(Social Map)的针对O2O的产品。他希望这款产品能够告诉用户这个世界的任何地点此刻最受欢迎的话题是什么。ZoomSocial 从此诞生了!

蹒跚创业

Zoom Social并不是杨绍峰创业的第一次尝试,09年至10年的时候,杨绍峰开发了一个实时跟踪定位的应用。在这个应用的基础上进一步研发出了一个可以流水式跟踪有成百上千人的群组的实时跟踪系统。11年底,杨绍峰回到北京开始全职创业,全身心的投入使得这个软件的技术发展到很高的水准和复杂度,能够高效率高精度的定位用户地点和预测用户常去的地方。但是由于隐私保护的问题,杨绍峰发现多数用户并不像自己那样愿意将自己的位置暴露给别人。因此这个应用的使用人数很少,最终也没有能够正式得以发布。

尽管如此,杨绍峰还是收获了很多,包括研发成功了基于定位(位置信息)的实时数据处理引擎(Locationbased Real Time Big Data Processing Engine)。杨绍峰在此基础上产生了两个想法:(1)将这个应用保留以等待合适的时机发布。例如,在车联网的时代里,这个应用一定会有用武之地。(2)在已经开发的技术的基础上寻找新的应用。Zoom social正是在这样一个数据分析引擎的基础上创立的。

小到五米之内,大到全世界

现今市场上对于地理定位的大数据信息的采集和分析多数是构建在Hadoop上的。但是,正如大家所知,基于批量工作(Batch Job)的传统Hadoop在分析数据时无法具备实时性。通常人们需要等待一段时间才能出分析结果。因此传统的Hadoop并不适合分析、展示社交媒体实时发生的事情。为了解决这个问题,Zoom Social使用了自行设计的包含内存计算,异步通讯和实时流处理等的Hadoop大数据平台。并且为了更好的与实际地理位置结合,还推出一个基于网格分析的动态地图引擎(Dynamic Map Engine)。

在传统地图工具的帮助下,人们可以看见周边发生的事情及讨论,但却很难看到全城、全州或全国的数据。原因是在大范围内有太多地理位置的网格,导致数据量过大,难以进行实时处理,因此任何现存的地图都只能查看周边地区。另外,一些号称“最快”的利用地理定位大数据做分析的公司所运用的模式实际上是将很多很小的batch job累计起来处理结果,因此理论上并不可能做到实时。而ZoomSocial则通过使用自己设计的大数据处理平台和动态地图引擎,在设计理念上就彻底改变了这一现象,可进行与前期设计相比没有任何延迟的真正意义上的实时分析,从而在不同地域范围内同时处理多项请求。

为了更加形象的描述Zoom Social如何利用机器学习加地点定位对数据进行分析,杨绍峰举了一个形象的例子。假设某人发了一条Twitter:我和Steve Jobs正在天安门吃着烤鸭。Zoom Social在得到了这一条信息后,即迅速将关键字:Steve Jobs,天安门,烤鸭,提取出来,然后在小范围(本地)或大范围(全国)地区内进行搜索,统计多少人对这些关键字进行讨论,以及讨论的人的社交影响力。然后对这些话题、信息以及信息发布人按受欢迎的程度进行排序,从而分析出该区域内最受欢迎的话题和人,并将这些话题和人向用户进行推送。

Zoom Social目前已经实现了Twitter,的海量数据整合,并开始了Instagram 和 Facebook 的数据整合的海量数据整合。自去年 12月起, 每天在北美 4 个trillion级的地区上实时处理20M的Twitter信息。Zoom Social基于地理位置及基于机器学习进行实时分析,小到5米之内,大到全世界的可搜索话题都可以被覆盖。

将社交媒体的大海放进了鱼缸

杨绍峰说,他希望最后能够通过Zoom Social帮助用户重塑社交习惯。使用Zoom Social可以看到周围发生的最热门的事情,而不只是传统社交网络中自己的朋友分享的内容。现在弱社交中的重要的一个特点是从人到内容,我们希望通过Zoom Social实现从内容到人。

杨绍峰认为在社交网络时代,每个社交网络就像江河(比如Twitter、Facebook都是不同的河流),这些河流最终都会奔腾入海。对于使用社交软件的个人来说,他们只是在河边取一瓢水,没有人看到大海是什么样的。Zoom Social希望将社交媒体这片大海放进了鱼缸,用户可以从不同角度去揣摩、观察,从而渗透入大海里面任何细小的地方,从大数据(big data)到微数据(microdata)。用户不仅能看到哪些照片或话题是流行的,还可以看到具体是什么人去讨论这些流行的照片、话题。这恰恰是传统社交软件无法做到的。

小编评论: 与绍峰短短一个多小时的交谈,足以让小编们深刻的感受到他对于创业和生活的激情。拥有丰富的人生和创业经历的绍峰,带着那份创业者所必须具备的自信,不断的向小编们传播着正能量。小编也希望能将此正能量以文章的形式传递给文摘的读者们。 在准备本期采访期间,正值2015年度的SXSW盛典。小编在盛典现场亲身体验了一把Zoom Social带来的“从内容到人”的新社交理念。例如,新晋的摇滚流行歌手们通过Zoom Social扩大自己的知名度,更好的与粉丝们互动。粉丝们也可通过Zoom Social找到最fan的摇滚歌手。小编认为如同多数B2C的初创公司一样,Zoom Social还需要继续扩张自己的用户群体范围,并且思考如何能从已有的市场中创收。亲爱的读者们,你们对此有什么样的看法和建议呢?欢迎后台留言。

点击视频了解更多zoom social相关信息

采访撰稿:刘小娇,阚玺,魏子敏

感谢Locus Social, Inc.提供图片及相关资料

【原点栏目成员介绍】

有意联系栏目组成员的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。

阚玺:原点栏目主编,2012年获得美国纽约州伦斯勒理工学院决策科学专业博士学位。攻读博士期间,致力于决策模型,运筹管理及数据挖掘等多项领域的开发与研究。毕业后作为一名资深决策分析师先后加入Memorial Sloan-Kettering Cancer Center 的战略计划团队和RetailMeNot, Inc.的商业智能和分析团队工作。主要负责运用统计模型,统计测试及最优化分析向公司管理层提供商业及产品方案的决策建议。希望通过大数据原点平台与从事网络产品开发,电子商务的朋友以及致力于IT领域的创业朋友互相交流学习。

刘小娇:盖洛普咨询高级统计分析师及品牌战略咨询师、《阿里商业评论》特约撰稿人。现居美国华盛顿特区。任盖洛普多项全球调查及美国居民幸福指数实时调查首席分析师。合作撰文内容涵盖政治、经济、国际金融、健康等领域。从事各项数据分析及可视化工作。如有对移动医疗领域、统计建模、大数据应用及可视化感兴趣,有志创业的同仁,请给她留言。

魏子敏:香港中文大学新闻学硕士,乐于研究大数据与社会现象结合的效用。硕士期间利用大数据分析媒体报道的政治偏向,2012年美国大选期间参与美国加州民主党竞选工作,搜集选民数据并统计数据反映的政治走向。怀抱新闻理想,希望使用更科学的数据做更好的新闻,也相信大数据与社会科学的结合存在无数可能性,望与更多志同道合的朋友共同交流进步。

于丽君:本科硕士毕业于清华大学数学系,硕士研究课题为图像修补问题建模,目前为美国Case Western Reserve University应用数学在读博士,研究方向为贝叶斯方法反问题建模,博士研究课题为利用MEG(脑磁成像技术)时序信号对大脑活动进行定位,对数学建模、机器学习、人工智能以及图像处理等方面有广泛兴趣,希望可以通过原点栏目组,结识更多相关领域的朋友以及有志于创业的同仁,互相交流进步。

闫瑾:原点栏目采访联络人, 2004年兰州市高考理科状元,清华大学数学系本科,美国马里兰大学数理统计专业博士。博士期间主要研究眼动数据(eye tracking)在医疗、市场营销方面的应用,以及HIV药品的临床数据分析。目前在美国某大型金融机构任金融经济学家,构建产品的信用风险预测模型(credit risk model)以及定价模型(pricing model)。期待通过原点认识更多有志于大数据相关产业创业的朋友。期待意愿在原点展示自己项目的初创企业联系我。同时现正组建自己的团队,为顾客提供大数据咨询服务(分析,建模,解决方案,模型测试等),有项目需求者请联系: smallbear@bigdatadigest.cn

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2015-04-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

硅谷专家解答人工智能 6 个最火爆问题(AI的最大秘密和下个研究中心等)

Siri 的共同创立者 Cheyer 说,在做 Siri 的时候经历了一些有趣的事:当把 Start Over 输入的时候,系统却开始寻找路易安娜的 Ov...

34140
来自专栏大数据文摘

情感计算步步进入商业调研领域

14120
来自专栏数据派THU

50个“杀手级”AI项目 !(附链接)

原文标题:50 Killer AI Project 编译:言泽 作者:Steffi S 本文为大家带来50个当下正火的AI项目,总有一个会让你感兴趣。 这个世...

62860
来自专栏PPV课数据科学社区

真相:你被过滤泡泡包围了

? 一个月前,《连线》杂志的撰稿人马特•霍楠(Mat Honan)在Facebook信息流里做了一个试验:依次对他喜欢的、讨厌的甚至痛恨的内容点赞,看会出现什...

32950
来自专栏新智元

AI不再需要“程序猿”,未来数据比代码重要

钛媒体注:过去,程序员就像是上帝,制定计算机系统运行的律法。随着机器学习的兴起,计算机正在脱离人们的控制。工程师们永远也无法确切搞清楚计算机是如何通过机器学习...

37370
来自专栏java一日一条

良心干货!如何惊呆你的面试官

根据几年前流传的一则故事,Google曾将它的Lvl.99数据处理技术应用于面试和业务评价过程,目的是要试着回答一个问题:面试中显示出的哪些特质最能预示其在公司...

10010
来自专栏数据的力量

剑桥大学:语言和写作决定人生发展的潜力

那些历史上的名人不必多提,只说在平时的生活中随处可见的:去学院餐厅吃饭,对面坐过来一位长者,英国人,已经90岁,一口流利的汉语,说自己1947年曾在北平工作,后...

17830
来自专栏数据猿

数据猿专访 | 博乐互动CEO王岭峰:世预赛、五大联赛已打响,大数据告诉你该买哪支队!

<数据猿导读> 9月份伊始,2018世界杯预选赛展开了最新的一轮角逐。球迷朋友们更关心的是,到底哪支队会赢?又该买哪支队呢?大数据专家表示,通过球赛、球队和球员...

374110
来自专栏互联网数据官iCDO

调研1个月,我们总结了3个视频信息流广告趋势

TopMarketing 本文转载自 TopMarketing 广告圈变得有多快?想必和周杰伦歌中的“龙卷风”差不多。 当品牌们上一秒还在谈论TVC广告和视频...

380100
来自专栏我是攻城师

如何在三个月内获得三年的工作经验?

497140

扫码关注云+社区

领取腾讯云代金券