【资讯】IBM通过超级计算机使用大数据来解决大问题

IBM喜欢大数据,获取的越多,就越能向用户销售出更多的服务器、存储和服务。但是由于IBM获取的大数据容量已经过大,导致这家公司的研发人员很难驾驭这些数据。举 例来说,IBM位于硅谷阿尔马登研究中心的专家劳拉·哈斯(Laura Haas)去年就曾询问同事,她为什么不能使用更大的数据集。哈斯当时就曾表示,单是准备数据就花费了他80%的时间。哈斯意识到,IBM研究时间被数据 分析耗费的越多,该公司的专家就会耗费更多的时间和精力用于扩展数据集,从而放缓研发的步伐。很 明显,这种事情应当交付给专业的数据科学家来解决,但是这样的循环只能让情况变得更加糟糕。还有,它似乎有悖于大数据的常规,因为依据存储能力的扩展或是传感器成本的下滑,大数据的价值并不受摩尔法则或是克来德法则(Kryder's Law,每10.5年硬盘驱动器的信息密度就要增长1000倍,也就是说,每13个月存储密度就要翻一番)支配。当 然,大数据更适用于“麦特卡夫定律” (Metcalfe'sLaw)。该定律指出,网络的价值等于网络用户数的平方数;增加网络和其他通讯技术的接入用户数量,将获得巨大效益。 对IBM的研发人员而言,情况也确实如此。为解决这一问题,IBM硅谷阿尔马登研究中心在去年秋季推出了“加速发现实验室”(Accelerated Discovery Lab)。这个实验室有着非常大、开放的空间,能够装配舒适的家具、白板以及许多的屏幕,更别提循环参与的项目团队、系统管理员、访问客户、人类学家和 IBM Watson超级计算机。正如这个实验室的名称所暗示的那样,它的目标是使用多元化、邻近、物理空间的最优组合破解代码。目 前担任该实验室技术和运营总监的哈斯对此表示,“我们把它称为哺育‘战略意外发现。’这就如同是在淋浴时或饮水机旁找到灵感一样。我们希望把人们聚集在足够宽阔的环境中,让他们享受于此。通过利用房间的连接,数据的连接以及能够掌握用户正在做什么的能力,培育意外发现。”加速发现实验室的第一个项目是利用Watson超级计算机在新领域的自然语言处理能力,药物研究则是首选。通过与贝勒医学院计算机生物学家的合作,IBM的数据科学家开始在数以百万计的论文、专利和临床研究中采集数据,并最终把他们的注意力集中在了脑肿瘤抑制基因TP-53上。在几个月之 内,研发团队就找到了四个候选产品。“加速发现实验室”展露额和项目开发总监杰夫·威尔瑟(Jeff Welser)表示,“通常找到一个产品就需要约一年的时间。”这个速度确实已相当快,但能否更快一点?该实验室的使命之一,便是对自有空间的研究假设。哈斯表示,“我们当前尝试在项目开始就记录下来,看看这些白板和显示屏能否会获得明显的成效。”虽然IBM当前还没有计划在其它研发中心建造类似的实验室,但是哈斯希望有朝一日能够开发出一款软件工具,帮助公司管理自有资源。

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2014-08-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏鹅厂网事

Tencent OLS OPC-4 适配商用600G传输系统测试成功

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在...

4883
来自专栏码洞

《Redis深度历险》《深入理解RPC》答读者问

老钱,你好,不知道从哪个机缘巧合关注了公众号,看老钱的文章,收获很大,最近在读redis小册,对我做业务开发的帮助挺大的。我也买了好多书,看了很多博客,开了公众...

1592
来自专栏前沿技墅

一个图书策划的自我修养之一:这个产品不寻常

1676
来自专栏镁客网

谷歌,你调皮了!

因AI的加入,学术研究变得不再枯燥,甚至正以一种“调皮”的姿态获得了用户更多的宽容。

1503
来自专栏全栈工程师成长之路

如何做一个优雅的程序员如何构建适合自己的学习体系

43217
来自专栏机器人网

触摸未来:为什么说AR是未来最重要的人机界面

在我小时候,对二郎神这个角色甚是喜欢,尤其是他眉心之上的第三只天眼。不仅仅具备遥望千里之外的超视距能力,更能洞察周遭一切,连孙悟空变化出来的幻相,也能最视真实。...

2917
来自专栏CDA数据分析师

【技术贴】物理学博士教你怎样分析微博数据,怎样涨粉

网上已经有太多关于怎么增加微博粉丝数,以及怎样让我们发的微博获得更多转发的建议了。我们并不知道这些建议是否有效,因为它们大都是建立在个人感觉上,而缺乏真正有说服...

1978
来自专栏腾讯社交用户体验设计

为什么依照需求输出,结果却不尽人意

2006
来自专栏大数据文摘

业界 | 想转行?数据科学全流程求职指南

1977
来自专栏PPV课数据科学社区

【推荐】广告主不知道的13条数据

1在刷朋友圈时间上,“60前”平均花费时间的最小值为47分钟,“90后”为42分钟。 ? 各年龄组平均刷朋友圈时间最小值估计,腾讯研究院 2015年6月 “60...

3549

扫码关注云+社区

领取腾讯云代金券