前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >The Wolfram Data Drop 技术_II

The Wolfram Data Drop 技术_II

作者头像
WolframChina
发布2018-05-31 15:55:23
3960
发布2018-05-31 15:55:23
举报
文章被收录于专栏:WOLFRAMWOLFRAM

The Wolfram Data Drop 技术_II

(接上篇) 值得一提的是,当我们从数据仓中获取数据时,获取的不仅仅是原始数据,还有一些其他关键信息。这个例子能体现 Wolfram Data Drop 的一个关键特征:Wolfram Data Drop 不仅储存原始数据,还能够储存这些数据发生时的各种关键因素,这样一来,用户在任何时候都能清晰、直观地理解这些数据。为了实现这一功能,我们采用了一项先进技术:Wolfram数据框架(WDF)。

WDF 创建之初通常与 Wolfram|Alpha 搭配使用,它是真实世界数据的标准符号代表。Wolfram Data Drop 里的每一个数据仓都可运用 WDF 定义一个数据语义签名来详细说明这些数据该如何解读,以及我们的自动导入和自然语言理解系统该如何处理这些新数据。

以上这些功能的妙处在于,只要数据存在于 Wolfram Data Drop,用户就可以随时随地利用Wolfram 语言以及安装 Wolfram语言 的其他任何系统解读和获取这些数据。譬如,利用Wolfram|Alpha 以及应用 Wolfram|Alpha 的其他智能设备,我们可以立即获取储存于Wolfram Data Drop中的任何公开数据仓。我们只需要告诉 Wolfram|Alpha 该数据仓的名称,它就会自动分析并生成关于该数据仓的数据报告。

通过 WDF,Wolfram Data Drop 可以立即处理10000种以上不同的计算单位和物理量。但 Wolfram Data Drop 并不只局限于处理数字或可量化数据,如果需要,你甚至可以存入任任何信息。由于Wolfram语言是一种符号语言,它可以对这些信息进行统一处理。

Wolfram Data Drop自动会对存入的数据附上时间戳,并也在具有定位功能,这两项功能在WDF中有明确的标准表示,类似的功能还有化学、城市、物种、网络以及其他的成千上万种事物。当然你也可以将图片等文件存入Wolfram Data Drop。

在我们公司的产品质量部,公司同事将树莓派上连接的摄像头放置在最近买的两条金鱼前面,相机每十分钟拍摄一次并将拍摄的照片传入Wolfram Data Drop的数据仓中:

利用Wolfram语言,我们能轻松地将这些一系列照片三维层叠在一起:

我们也能通过处理这些照片得到金鱼在鱼缸空间位置的停留时间的热力图:

利用Wolfram语言,我们能做各种各样的分析。但最令我激动的是,通过Wolfram Data Drop,将真实世界的数据转化为Wolfram语言实在是太方便了!

在我们公司里,使用数据仓的人数增加得非常快,因为创建数据并连接至现有的监控系统实在是太轻松了。目前,我们已经为服务器机房的空调系统、总部大厦房顶的气象传感器、休息室的冰箱、网络链接数据以及Data Drop自身的性能建立了相应的数据仓。而为不同事物建立的数据仓个数每天都在增加。

同时,个人数据仓的个数也在增加。我自己就一直非常喜欢搜集自身的相关数据,实际上我已经搜集25年以上了。但我断定2015年3月是一个历史性的转变,因为通过Data Drop,搜集数据变得非常简单,这也意味着我搜集的数据将越来越多.。现在,我拥有一个至少记录了我25年个人数据的数据仓,而这个数字还将不断增加。值得注意的是,由于Wolfram Data Drop里的所有数据都是储存在WDF中,这些数据都是经过语义化和标准化的。也正因为如此,用户能够直接将完全不同数据仓里的数据进行对比,并用来进行许多有意义的计算。

只要你存储的数据量不是很大,Wolfram Data Drop 都是完全免费开放的,任何人都可以通过任何设备立即将数据存入其中。我们的付费用户则可以存入更多的数据.

Wolfram Data Drop数据仓可以公开也可以私有,或者可以设置身份验证. 任何人都可以通过Wolfram Cloud 访问Wolfram Data Drop。获得Wolfram Private Cloud 的组织或机构也将很快就能拥有其内部专属的 Data Drop。

那么,运用Wolfram Data Drop的标准工作流是什么呢?这取决于你具体要做什么。以我的经验看来,仅一个数据仓也通常需要多个工作流。

能够随时获取不同数据仓,直接应用于Wolfram语言会话的计算,还可以探索数据仓中的数据,甚至建立一个笔记本文档,这简直太便利了!

但在很多工作场景中,一些用户希望能进行一些自动操作。譬如:用户能够预先设置生成数据报告的时间,并发送至设定邮箱;能够将数据报告上传到网上,托管在Wolfram Cloud上,或者利用Cloud CDF让每个人都能对该数据进行探索和研究;每当有人访问页面时,就自动生成一个新报告,或者用户可以创建一个可视化数据的UI仪表板显示实时报告。

实际上,我们的数据报告不仅仅可以在网上分享,只要将其储存于Wolfram Cloud中,用户可以立即从手机或可穿戴设备获取该报告。同时,用户也可以通过桌面系统获取报告。

用户并不需要手动生成报告,用户需要做的只是编写一段Wolfram语言程序来监听数据仓,在满足用户预先设置的条件下时,自动发送信号或执行指定动作。用户可以将数据仓访问权限设置为公开,通过这种方式来公布和分享数据;也可以将数据仓访问权限设置为私密,只有自己和指定用户可以访问。用户可以建立一个API,通过API来访问原始或是经过处理的数据仓,这样一来,用户不仅可以从网上读取这些数据仓,还通过任何编程语言和编程系统读取。

单个数据仓里的数据可以只从单个来源获取数据,也可以成为一个聚合点,从多个来源获取数据。由于每一个数据片段都被详细地记录在数据元中,因此用户可以清楚的分辨这些数据的来源。

这些年来,我们一直在和一些研究连接设备的公司打交道,尤其是在我们的连接设备项目中。以下场景曾多次发生过:某公司给我介绍他们正在研究的非常棒的新型连接设备,这种连接设备可以测量非常有趣的事物。我问他们,那你们怎么处理这些连接设备上的数据?通常情况下,他们会告诉我他们也在考虑这个问题,他们不想专门雇一个团队来建设云架构、仪表板和相关的应用程序等。

我们构建Wolfram Data Drop的原因之一可以说是为了解决这些公司的难题。现在他们只需要搜集数据,然后储存到Data Drop,这些数据就会上传到我们的云端(或是他们自己的专有云端),这样一来,他们就可以十分便捷地通过网页、应用程序、API以及其他很多方法获取这些数据。

从目前的趋势看来,很多设备公司都将用到 Wolfram Data Drop。他们可以通过多种不同的方式将数据导入其中:API、直接连接 Wolfram语言、树莓派电脑、开源软件、Electric Imp 以及其他Data Drop兼容硬件设备等。此外,他们还可以通过手机、其他智能设备以及通过已经储存了数据的其他云端导入数据。

目前,我们没有特别好的方法解决如何WIFI和蓝牙等设备导入数据到Data Drop的问题。但是我们正在为此而努力,这样一来,当我们解决了以上难题时,从那些设备导入数据到Wolfram Data Drop 就更为便捷了。

从连接设备中获取数据的方式是多种多样的。开发者和研究人员可以通过云端或桌面版的Wolfram语言从Wolfram Cloud中直接获取数据。面向用户的驱动设备公司可以通过Wolfram Cloud建立专属数据入口,他们还可以通过Wolfram移动应用程序或者他们自己的移动应用程序获取数据。此外,我们还可以通过可穿戴设备来获取数据。

有时候,一些公司希望能从多个设备中搜集数据,比如在监测网络和调查研究等项目中。同时,他们的用户也希望能直接通过Wolfram语言、数据入口或应用程序进行操作。

当我第一次想到Wolfram Data Drop时,我认为储存在当中的绝大部分数据应该来自自动设备。但现在,我意识到Wolfram Data Drop对于处理我们人类活动的相关数据也是非常有用处的。我们可以利用Wolfram Data Drop搜集课堂问题答案、整合众包项目中的反馈意见、以日记形式记录信息、记录生命日志等。而Wolfram Data Drop能够根据这些数据自动生成数据表单,我们可以在手机和互联网中分享这些数据表单。

Wolfram Data Drop表单支持文字、图片等格式。当内容为文字时,我们的自然语言理解系统接受文字输入并将其自动将其转化为WDF标准格式。

现在,我们已经可以使用Wolfram Data Drop,我不断地发现它的功能性和实用性,我甚至不敢相信我居然在没有它的情况下生活了这么多年。通过Wolfram语言,Wolfram Data Drop充分体现了其智能自动性:Wolfram Data Drop可以自动过滤许多从外界获取数据时掺杂的多余的影响因素。

这样一来,我们不需要建立其他专门的处理系统,用户自己就能搜集和分析各种数据。譬如,上周我利用Wolfram Data Drop搜集我们云性能的数据,一般情况下我根本不会自己做这件事,因为这非常复杂和繁琐。但利用Data Drop,我只花了几分钟设置,就获得了非常有趣的结果。Wolfram Data Drop的功能让我感到兴奋和激动,我能利用它做很多事情!同时我也很期待大家会用它来做什么。大家可以在这里下载尝试 Data Drop,并在这里提出反馈意见(当然这些都会被记录到Data Drop中)。我希望在不久的将来,我们的数据仓能够成为探索世界基础构架的一部分:这也是我们达成实现"可计算的世界"这个目标下一步要做的事。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 WOLFRAM 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档