为什么ICA是真正的ECM

ICA(Intelligent component analysis/智能内容分析),将为企业提供一个丰富的我们在过去认为不可能的预测信息领域。

多年以前,医疗公司就如何管理,申报和提交药物开发信息给相关管路机构而操碎了心。为了申报药物研发审批备忘录,他们必须以一种一贯的方式提供有关临床试验,药理学观察,医生笔记,患者记录在内的所有细节给有关部门。

然而,这些信息以多种不同的格式管理储存,例如X光片,核磁共振图谱等。这就导致了不同格式的内容在存储,分析以至标准化方面存在巨大的困难。

图片来源于网络

为解决这种痛点,企业内容管理系统应运而生—— Enterprise Content Management (ECM)。

企业内容管理技术被寄期望于用一种统一的格式去代替所有不同格式的内容,从而实现对内容更加简便高效的管理和分发。

然而,它的固有缺点是它(信息系统)并不能理解它所存储和管理着的内容。任何描述性信息或分析结果都是由用户,或者,很多时候也是由通过摘录相关信息的工作流程添加进系统的。如果是医学图像文件,系统更希望以元数据或者DICOM格式对信息进行摘录。然而,以上的各种被系统摘录的信息格式都不是最终可信赖的分析结果;而且,它们是静态的存在,在大多数情况下,一旦被记录入系统,就会失去时效性。

ECM系统包含许多不同的应用功能,比如web内容管理系统,文档管理系统和图像管理系统。每个系统也可以有一个记录管理的方法或模块,但这些系统并不会主动整合内容来做内容分析。一些ECM供应商着眼于添加更多模块 - 也就是说,他们在通过加固系统 - 以解决传统ECM的一些缺点;但是,这些系统将受到原始应用程序架构的限制。

到了今天,信息内容逐渐向图片化,视频化过渡。你可以发现,仅仅着眼于手动添加的或者由系统生成的元信息已经远远不能够让你对所持有的数据做更加深入的了解。据估计,在所有被存储的信息中只由大约0.5%的信息会被用来生成可供系统学习分析的结果或数据。想一想,如果孩子只能拿出0.5%的他所接触到的信息去学习,他需要多长时间才能成长。

因此开发出一套和人类的学习认知体系类似的系统是十分有必要的。当孩子所有的感官被分别用来观察,聆听,品味和感受外界对象的时候,他们进步最快而且能汲取最多的知识。尽管计算机系统目前来看可能还做不到品尝或感受,但它能够做到“聆听”“观察”和“阅读”。因此,智能内容分析(ICA)是非常重要的,因为它让系统使用占比99.5%的未开发信息,并以最全面和最快的方式使用它。

我们以前没听过吗?Autonomy公司做出了旨在实现智能内容分析的Idol平台。总之,这是一个基于市场营销和公关的ICA解决方案。实际上,Idol平台从来都没有能力用与人类相同的方式处理这些信息,因为它并不具备(让这一切实现的)技术条件。所幸,随着GPU,TPU以及经过新型算法武装的专用学习处理器的发展,定制化的硬件在今天最终成为可能。

这些进步以及海量的由易于获得的位置坐标,云存储数据和服务数据所产生的信息使得像微软,亚马逊,Facebook和谷歌这样的公司能够验证和完善相关的方法去将语言和图片转换成各种含义和系统可解读的内容。

在2017年伊始,微软和谷歌曾对外声称Word文档将语音转文字的错误率是6.3%。然后在几个月内,它得到再次改善,降到5%以下。

图像识别和随后的描述性生成等技术还不是很先进,但是毫无疑问地这些技术应用拥有极大的改进空间并且注定会迎头赶上。以误码率的重要性为例,Google刚刚发布了翻译耳机,可以近乎实时地翻译40种语言。如果没有我刚才提到的硬件的技术进步,以上发生的这一切都是不可能的。这就是为什么我们可以在大体上认定Idol不是一种ICA的解决方案的原因。

图片来源于网络

这对你来说意味着什么?

也许你以为这一切都是你知道的,但是这将如何使你或你的企业受益呢?为了回答这个问题,我们来看一些例子:

汽车安全

我们已经看到了自动驾驶汽车,特斯拉等公司正在自主驾驶领域的发展和进步。这些系统已经使用了视频,传感器和图片,但他们不使用声音。未来的系统将能够识别出像汽车轮胎刹车的尖锐的声音,这可以在潜在交通事故发生前及时的提醒驾驶员;智能系统可以通过收集动物声音或噪音来区分它所看到的物品,并且会在几秒钟内知道它们是什么以及如何躲避它们。这种类型的ICA和学习并不遥远。

医疗诊断

为了高效的诊断病人,医生已经可以通过使用望闻问切甚至通过病人口头描述的感觉和内部扫描等信息作为诊断的参考内容。医生需要评估所有这些项目,以提供潜在原因的诊断用来确定治疗措施。随着ICA的进步,一个系统将能够持续不断地采用所有可用的方式反馈来监测病人的病情,然后将其录制并转化为可被机器学习和应用的语句和词汇。和汽车一样,这样的系统将给医生确诊提供一种快速的评估和建议的行动方案。

这将如何使企业用户受益?

如果你看了以上的这些例子,它们将如何使企业用户受益呢?最基本的好处是让这些企业用户能够使用他们所持有的99.5%的未开发信息中的一部分来学习,并发现并应对潜在的风险或提高回报。

然而,促成这一切发生的最大和最重要的进步是有关自动生成供机器学习的数据的技术的进步。另一个重大的进步是自然语言生成(NLG)。正是这个被用于将诸如图片,视频,音频等数据元素标准化成持续地信息流这一过程让旨在教机器用类似于人类建模的思考方式去学习的算法成为可能。

人类的大脑通过标准化的冲动,生物电和激素高效的调动与调控我的自身的诸多传感器,这是一项了不起的工作。就像人脑用图像来标准化单词,增强自己的联想和学习能力一样,ICA将为企业提供丰富的可用于产生过去被认为不可能的预测结果的信息领地。

原文链接:https://www.infoworld.com/article/3237988/analytics/why-ica-is-the-real-ecm.html

原文作者:Kevin Gidney

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏罗超频道

小程序上线在即,App不会死,但移动互联网却会变天

张小龙在2017微信公开课Pro上发布的小程序即将在1月9日正式上线。在张小龙发布小程序之后,有两家来自杭州的创业者称,它们的估值均上涨了10倍——吸引眼球的成...

2826
来自专栏人称T客

主流大数据分析软件全面接触

现在很多厂商都说自己的产品是大数据分析软件。如果只是根据功能去区分这些产品,的确是件难事,因为很多工具具有相似的特征和功能。此外,有些工具的差异是非常细微的。所...

3708
来自专栏互联网杂技

创业做一个App究竟要花多少钱?

作为互联网从业者,被外行的朋友们问及最多的问题是: “做一个网站需要多少钱?”或者“做一个APP需要多少钱?”。 作为做过完整网站项目和APP的人,今天从产...

4107
来自专栏BestSDK

Win10一波大更新来袭:3D、VR、直播一样不能少

微软即将在明年春季向全球超过 4 亿 Windows 10 用户推送一次重大更新。这次更新名为 Windows 10 Creators Update(创作者更新...

3059
来自专栏疯狂的小程序

小程序火爆的因素

几天前,我重新翻阅了2017年5月写的一篇关于小程序的文章,文章虽青涩但还算精确,文中阐述了三个观点:

20410
来自专栏MasiMaro 的技术博文

毕业两年的反思

到今年6月份,已经毕业两年了,在这两年中换过一家公司,从银行外包到安全行业,经历过加班,也经历过无所事事,心中有些感慨和想法与大家分享

1122
来自专栏鹅厂网事

在苦难中的成长--从某宝某程故障看互联网业务系统可用性

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

2449
来自专栏ytkah

林兴爆料小程序很快可以支持各个 App 直接打开小程序

1952
来自专栏知晓程序

微信悄悄上线的 2 个小程序,暗藏一统社交电商的野心

1074
来自专栏互联网数据官iCDO

营销技术进入到后平台时代了吗?

译者:池金锐 本文长度为3168字,预估阅读时间5分钟。 营销技术进入到后平台时代了吗?本文给出了一个充分的解答。 ? 当我们发布2017年市场营销技术展望时,...

2595

扫码关注云+社区