为什么ICA是真正的ECM

ICA(Intelligent component analysis/智能内容分析),将为企业提供一个丰富的我们在过去认为不可能的预测信息领域。

多年以前,医疗公司就如何管理,申报和提交药物开发信息给相关管路机构而操碎了心。为了申报药物研发审批备忘录,他们必须以一种一贯的方式提供有关临床试验,药理学观察,医生笔记,患者记录在内的所有细节给有关部门。

然而,这些信息以多种不同的格式管理储存,例如X光片,核磁共振图谱等。这就导致了不同格式的内容在存储,分析以至标准化方面存在巨大的困难。

图片来源于网络

为解决这种痛点,企业内容管理系统应运而生—— Enterprise Content Management (ECM)。

企业内容管理技术被寄期望于用一种统一的格式去代替所有不同格式的内容,从而实现对内容更加简便高效的管理和分发。

然而,它的固有缺点是它(信息系统)并不能理解它所存储和管理着的内容。任何描述性信息或分析结果都是由用户,或者,很多时候也是由通过摘录相关信息的工作流程添加进系统的。如果是医学图像文件,系统更希望以元数据或者DICOM格式对信息进行摘录。然而,以上的各种被系统摘录的信息格式都不是最终可信赖的分析结果;而且,它们是静态的存在,在大多数情况下,一旦被记录入系统,就会失去时效性。

ECM系统包含许多不同的应用功能,比如web内容管理系统,文档管理系统和图像管理系统。每个系统也可以有一个记录管理的方法或模块,但这些系统并不会主动整合内容来做内容分析。一些ECM供应商着眼于添加更多模块 - 也就是说,他们在通过加固系统 - 以解决传统ECM的一些缺点;但是,这些系统将受到原始应用程序架构的限制。

到了今天,信息内容逐渐向图片化,视频化过渡。你可以发现,仅仅着眼于手动添加的或者由系统生成的元信息已经远远不能够让你对所持有的数据做更加深入的了解。据估计,在所有被存储的信息中只由大约0.5%的信息会被用来生成可供系统学习分析的结果或数据。想一想,如果孩子只能拿出0.5%的他所接触到的信息去学习,他需要多长时间才能成长。

因此开发出一套和人类的学习认知体系类似的系统是十分有必要的。当孩子所有的感官被分别用来观察,聆听,品味和感受外界对象的时候,他们进步最快而且能汲取最多的知识。尽管计算机系统目前来看可能还做不到品尝或感受,但它能够做到“聆听”“观察”和“阅读”。因此,智能内容分析(ICA)是非常重要的,因为它让系统使用占比99.5%的未开发信息,并以最全面和最快的方式使用它。

我们以前没听过吗?Autonomy公司做出了旨在实现智能内容分析的Idol平台。总之,这是一个基于市场营销和公关的ICA解决方案。实际上,Idol平台从来都没有能力用与人类相同的方式处理这些信息,因为它并不具备(让这一切实现的)技术条件。所幸,随着GPU,TPU以及经过新型算法武装的专用学习处理器的发展,定制化的硬件在今天最终成为可能。

这些进步以及海量的由易于获得的位置坐标,云存储数据和服务数据所产生的信息使得像微软,亚马逊,Facebook和谷歌这样的公司能够验证和完善相关的方法去将语言和图片转换成各种含义和系统可解读的内容。

在2017年伊始,微软和谷歌曾对外声称Word文档将语音转文字的错误率是6.3%。然后在几个月内,它得到再次改善,降到5%以下。

图像识别和随后的描述性生成等技术还不是很先进,但是毫无疑问地这些技术应用拥有极大的改进空间并且注定会迎头赶上。以误码率的重要性为例,Google刚刚发布了翻译耳机,可以近乎实时地翻译40种语言。如果没有我刚才提到的硬件的技术进步,以上发生的这一切都是不可能的。这就是为什么我们可以在大体上认定Idol不是一种ICA的解决方案的原因。

图片来源于网络

这对你来说意味着什么?

也许你以为这一切都是你知道的,但是这将如何使你或你的企业受益呢?为了回答这个问题,我们来看一些例子:

汽车安全

我们已经看到了自动驾驶汽车,特斯拉等公司正在自主驾驶领域的发展和进步。这些系统已经使用了视频,传感器和图片,但他们不使用声音。未来的系统将能够识别出像汽车轮胎刹车的尖锐的声音,这可以在潜在交通事故发生前及时的提醒驾驶员;智能系统可以通过收集动物声音或噪音来区分它所看到的物品,并且会在几秒钟内知道它们是什么以及如何躲避它们。这种类型的ICA和学习并不遥远。

医疗诊断

为了高效的诊断病人,医生已经可以通过使用望闻问切甚至通过病人口头描述的感觉和内部扫描等信息作为诊断的参考内容。医生需要评估所有这些项目,以提供潜在原因的诊断用来确定治疗措施。随着ICA的进步,一个系统将能够持续不断地采用所有可用的方式反馈来监测病人的病情,然后将其录制并转化为可被机器学习和应用的语句和词汇。和汽车一样,这样的系统将给医生确诊提供一种快速的评估和建议的行动方案。

这将如何使企业用户受益?

如果你看了以上的这些例子,它们将如何使企业用户受益呢?最基本的好处是让这些企业用户能够使用他们所持有的99.5%的未开发信息中的一部分来学习,并发现并应对潜在的风险或提高回报。

然而,促成这一切发生的最大和最重要的进步是有关自动生成供机器学习的数据的技术的进步。另一个重大的进步是自然语言生成(NLG)。正是这个被用于将诸如图片,视频,音频等数据元素标准化成持续地信息流这一过程让旨在教机器用类似于人类建模的思考方式去学习的算法成为可能。

人类的大脑通过标准化的冲动,生物电和激素高效的调动与调控我的自身的诸多传感器,这是一项了不起的工作。就像人脑用图像来标准化单词,增强自己的联想和学习能力一样,ICA将为企业提供丰富的可用于产生过去被认为不可能的预测结果的信息领地。

原文链接:https://www.infoworld.com/article/3237988/analytics/why-ica-is-the-real-ecm.html

原文作者:Kevin Gidney

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

分享 | 一个文科生学习R语言是种怎么样的体验?

首先介绍一下本人的相关情况:本人毕业于不入流的大学,专业是英语。数学水平在高中水平,因为大学文科专业不需要学习高数等课程,以前以为这是很大的好处,但是现在觉得这...

1955
来自专栏云计算D1net

公共云为业界带来了机器学习服务

机器学习代表着计算新领域,而公共云正使这项原本高大上的技术变得比以往更亲民、更实惠和更可用。但是,这并不意味着随便什么人都应该趋之若鹜。 机器学习是基于传统人工...

3289
来自专栏CSDN技术头条

【BDTC 2015】互联网大数据分论坛:滴滴、百度、京东等大数据实践

2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办,...

2139
来自专栏互联网数据官iCDO

必须要掌握的5个电子商务归因模型

译者:熊兔兔 本文长度为4128字,预估阅读时间7分钟。 我们今天要向大家介绍5个电子商务归因模型。 文章开始之前需要各位先了解一个事实:归应分析模型是一个让多...

2609
来自专栏程序你好

机器学习等新技术正在重塑工厂的工作方式

在过去的三十年里,工厂经历了翻天覆地的变化。80年代和90年代,工业自动化和机器人走在了前列。在过去的十年里,多种改变游戏规则的技术正在重塑工厂。机器学习、物联...

1003
来自专栏ATYUN订阅号

英特尔将收购芯片提供商eASIC,加快发展FPGA

今天,英特尔宣布计划通过收购总部位于加利福尼亚州圣克拉拉的领先结构化ASIC供应商eASIC,将其可编程解决方案组合扩展到包括结构化ASIC。eASIC拥有19...

843
来自专栏灯塔大数据

【连载•第一话】网络大数据技术与应用(上)

摘 要 简要介绍了网络大数据的概念,分析了运营商网络大数据的构成及带来的挑战,并从网络大数据存储与技术平台、感知与获取、清洗与提炼三个方面对运营商网络大数据技术...

3507
来自专栏技术翻译

目前占主导地位的19种AI技术

自然语言生成是一个AI子学科,可将数据转换为文本,使计算机能够以完美的准确度交流思想。

752
来自专栏MixLab科技+设计实验室

关于《2018科技中的设计趋势报告》的感想

行业惯例,每年总有一些“趋势”报告发布,比如前阵子的 2018 视觉设计趋势报告,还有最近的《 2018科技中的设计趋势报告 》。 在这里摘录几个报告中的观点:...

3316
来自专栏AI科技大本营的专栏

AI 技术讲座精选:无 IA(信息架构)不 AI(人工智能)

学习人工智能(AI)到底会如何影响我们个人生活和工作的各个方面? 利用人工智能技术的不同应用到底有哪些? 决策因素和具有典型应用、限制、考量因素和数据源的AI工...

28110

扫码关注云+社区