【深度】另类视角看百度迁徙图

【CCTV的赞誉】摘自CCTV晚间新闻 今天全国春运已经进入第10天,越来越多的人通过海陆空不同的方式往家里赶。36亿春运大军里面哪条返乡之路最热?不同的旅游线路的人们又有哪些特别的故事?“据”说春运,让我们用数据说说春运背后的故事。30年来,春运大军从原来的1亿人次,增长到今天的36亿人次,在春运这么短的时间内,36人次的大迁移,在过去我们真的很难去想象全国到底是怎样的景象?感谢大数据,在2014给我们带来最为直观的感受,下面这张图是百度提供的迁徙动态图,这些美丽的亮线就是春运路上大家的足迹,如果您使用过智能手机,并使用过定位功能的话,那么从您踏上旅途的那一刻开始,从出发地到目的地的数据就会在这张图上画出一条淡淡的线,人越多,这条线就会越亮。 大数据还告诉了我们什么,首先是最热线路排行榜,截止到今天晚上7点,8小时内排在前三位的是上海到滁州,天津到德州,还有成都到北京,一个非常有意思的发现是,成都往返北京的线路已经连续占据热门线路的前十名,昨天甚至排名第一位。橙色的线代表迁入成都的人流,而黄色的线代表迁出成都的人流量。

但是我们发现,不管到达还是出发,成都站都很热,而成都铁路局统计的数据也恰恰印证了这一点,从春运当天开始一直到昨天晚上8点,从成都火车站直达北京的人数为7335人,增幅较2013年超过60%,要知道春运30多年来,没到春运的前半段,差不多是这个时候,成都站所面临的最大压力是到达客流所带来的,但是今年,他们在原来的基础上,在送出旅客方面,同样投入更多的精力,也许呢,大数据到现在还不能具体的分析出乘车人的身份,不过成都火车站的一线人员有个特别的发现,那就是今年出发的人流当中,多了很多老人的面孔,而这在以前并不多见,老人们挤进春运大军都是要去儿女打工的城市准备过年,这样充分印证了专家的分析:逆向迁徙正在改变着今年的春运......

【我的疑惑】

  1. 为何是百度?从央视的报道可知,百度的算法是近似算法,前提是要用智能手机且使用过定位功能,有了这两个前提,百度才可以采集到所需数据,近似估计出哪部手机可能从哪出发到哪回家,才能画出这壮观精美的图画,但是从整合社会资源的角度看,这是巨大的浪费,因为百度所有需要的数据,铁路局都有,而且不是近似值,是精确值,清楚知道每个乘客的年龄、籍贯、性别、出发地、中转站、目的地,所以我要问:为什么是百度画出了这张图,而不是你,铁路公司!
  2. 新闻应该多严谨?如果要说明“逆向迁徙正在改变着今年的春运",至少应该拿些数据说话,到底今年春运这段时间有多少人“逆向”,有多少老人“逆向”?而不是仅凭火车站一线人员的某些“特别”发现。况且,老人一般都会与打工者错峰出行,未必使用智能手机,也不一定会用定位功能。而且,“逆向迁徙”这词可不是今年才开始用,搜搜百度“春运 逆向迁徙”,满眼都是去年春运的文章!所以建议,新闻应该严谨的要传达准确含义,应多做功课,不能只做“新”而不用“心”!

【老读悟的担忧】以下内容为授权转载

摘自:老读悟(微信公号:laoduwu666,博客:http://data12345.com/)

一种失望和担忧——再谈大数据的价值

一个央视和某巨头的合作项目,一个大数据、高科技风口浪尖的项目,顷刻间,各大小媒体的铺天盖地的称颂、赞美之词溢于言表,这是要“刷媒体”的趋势啊,仿佛大家都要说的什么,而我也要说点什么,说点做项目、做产品的初心,说点对国内大数据未来的担忧。 百度迁徙确实做了一些东西,海量数据的小时级处理,一定的可视化技术。但无论从项目思想、还是可视化的主体而言,都不是什么创新的东西,类似的、雷同的东西,相信从业者几年前就见过。并且,最重要的,它说到底是一个事后对数据的描述和展示,目前阶段的实际价值能有多大?对解决老百姓息息相关的春运问题的实际价值点在哪里?对政府的资源调配、社会决策能有多少立竿见影的效果?从现实情况看,恐怕还是新闻效应、政府关系效应效果更明显一些。 当然,这些都没有问题,毕竟有了新的数据、新的信息可参考,聊胜于无。但回归做产品、做项目的初心,我们为什么要做这样一个项目,真的是在为用户解决痛点问题吗? 大数据产品也是如此,真的是在用大数据为潜在用户解决实际问题吗?从大数据的概念提出,到目前也有几年时间了,国内一直处在“谈必大数据”的概念炒作阶段,不知道造就了多少砖家、叫兽。就拿春运来说,老百姓面临的问题是什么?怎么回,什么时候回,怎么中转,怎么抢到票,怎么避开中途可能的异常情况,甚至配套的黄牛识别问题,这些都是和大数据息息相关的,怎样采集更广泛的外部数据,怎样构建模型发挥大数据的分析及预测价值,怎么通过大数据产品的可视化技术连接用户,都是要考虑的环节。 对政府类用户而言,也有各种各样的问题需要大数据支持:各种交通资源的调配问题,特定交通线路的最优设计问题,异常时间的实时定位问题,交通拥堵的预测问题,甚至春运问题与老百姓满意度的问题,等等。 报个创新,搞个公关,这些真的不是最重要的,请回归做产品的初心吧。也期待大数据从业者可以从价值出发,推动国内大数据产业的良性发展,驱动更有价值大数据产品出现。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

盘点机器人发展不可或缺的八大技术

当前各个国家对机器人技术都是非常的重视,人们生活对智能化要求的提高也促进了机器人的发展,在这样的背景下,机器人技术的发展可以说是一日千里,未来机器人将在以下技术...

28870
来自专栏互联网数据官iCDO

“大数据"这词不火了 是不是因为没当年说的那么好

本文转载自网易新闻 网易科技讯 10月19日消息,国外媒体Slate刊文指出,“大数据(Big Data)”一词已经变得没有以往那么红火了,为什么会这样呢?“大...

32040
来自专栏镁客网

谷歌开发者大会背后的六件“密事”

17120
来自专栏钱塘大数据

【大咖说】吴军:数据为王和机器智能的时代

在清华大学的这次讲座,吴军博士的演讲主题聚焦在大数据和机器智能领域。以下是吴军博士演讲内容(略有删节): 今天的主题是“机器智能和2%的世界”, 这是今天讲座...

40560
来自专栏包子铺里聊IT

跟花和尚学系统设计:明星公司之Netflix(下篇)

谁是花和尚? 花和尚是一个定居西雅图的程序员,拥有多年系统设计和开发经验。喜欢研究和总结System Design, 并传授给大家。花和尚在MITBBS一篇 ...

34790
来自专栏大数据文摘

2016年下半年10个重要的可视化发展

17450
来自专栏镁客网

不明觉厉!这家电视台在欧洲杯上玩起了“时空穿越”

16140
来自专栏AI科技大本营的专栏

全网首发 | 科技超人马斯克的第四次惊天创举,这一次,他将拿人脑开刀(一)

这是一篇让科技迷们等了大半年的文章。 Tim Urban每每出一篇文章,总能引起科技迷们的狂热追捧。 Sorry,不止科技迷,没有任何基础的路人们,也能一口...

31670
来自专栏CDA数据分析师

小明说,我是数据分析师 ——-浅谈数据分析师的前世今生

“小明,听说你是数学专业出身的?”   “是的,领导。”   “那你去把这些手抄报表录入到电脑里去。”   “老板,请你尊重我的专业”   “那你把...

20780
来自专栏量子位

雷军把小米发布会开到华为门口,发布了安卓版iPhone X

13910

扫码关注云+社区

领取腾讯云代金券