中国科学院大学教授石勇
由中国人工智能学会发起主办,CSDN承办的2015中国人工智能大会(CCAI 2015)于7月26-27日在北京友谊宾馆召开。27日下午,“大数据的机遇与挑战”专题论坛在中国科学院大学教授石勇的主持下开始,他给出了讨论的7个话题方向:
清华大学计算机系副主任、国家“千人计划”特聘专家朱文武,复旦大学教授、上海市数据科学重点实验室主任朱杨勇,春雨移动健康CEO张锐,中科院计算所研究员何清,以及考拉征信首席技术官葛伟平受邀参与了本次讨论。
清华大学计算机系副主任、国家“千人计划”特聘专家朱文武
清华大学计算机系副主任、国家“千人计划”特聘专家朱文武从大数据的角度探讨了大数据和人工智能、数字驱动知识驱动和大数据的结合等方面相关的问题。朱文武首先讲到,目前正处于一个很好的时代,人、机、物所产生的数据无所不在,我们通过各种各样的设备将数据采集起来,大数据将带来产业变革和商业机遇。
朱教授讲到:从科学发展上来看,数据科学是将成为科学发展的第四范式,数据科学,是数据爆炸将理论、实验、计算统一起来的学科交叉。从数据中能不能体现出规律,这样特点使得有原来的模型驱动,经验决策转变数据驱动、数据决策。
朱教授认为大数据产生网络世界、物理世界和人类社会三元空间中。里面存在的核心问题是异构关联和数据发现。大数据处理的问题就是怎么样找知识和知识之间的关系,数据驱动更重要的是要知识驱动相结合,之前是应用和服务,现在把大数据驱动和知识驱动结合起来,可能是更好的方法。
对于类脑计算,朱教授认为将来还有很长的路可走。现在我们国家都在启动脑科学这种大项目,重大国家部署。希望将来有一天类脑计算能够像人的思维方式做一些认知,做一些知识生成,而不是像计算机一样去计算。
复旦大学教授、上海市数据科学重点实验室主任朱杨勇
复旦大学教授、上海市数据科学重点实验室主任朱杨勇表示,从百度那里看到大数据的定义是当前技术不能处理的数据集,朱主任认为这对人工智能从业者来说是好消息,因为他们可以有更多的事情去做,很多项目可以申请;另一方面很多大数据成功的案例使得全国人民知道大数据很好。
大数据最大的改变在于决策方式,大到国家层面小到生活层面,大数据在决策中均可以发挥其作用。今天所讲大数据,和以前讲信息化是有区别的,并不是带上大数据的帽子就是大数据,朱主任认为大数据是指为据测问题提供服务的大数据集、大数据技术和大数据应用的总称。
他提出,大数据问题的关键技术挑战在于:找到隐含在低价值密度数据资源中的价值,以及在希望的时间内完成所有的任务。用数据解决问题和解决数据的问题,这两项工作结合起来结合起来就是数据科学。
中科院计算所研究员何清
中科院计算所研究员何清的主题是《大数据与人工智能》,首先他提出人工智能的三个标志性事件:1996年5月11日深蓝战胜国际象棋冠军,代表着专家知识搜索能力首次超过人类。2006年深度学习图像识别人脸识别问题语言翻译取得突破,这就是在机器特征学习能力方面在大数据背景下打造与人相当的成功。2011年2月14日WATSON在知识竞赛获胜,大规模知识工程自动化能力这种首次超过了人类。
三次人工智能的突破的技术基础包括:分布并行计算环境,专家规则知识搜索,非结构化信息处理, 类人认知学习过程。
对于大数据下如何发展人工智能,他认为:
何清最后介绍了大数据挖掘算法的特征和挑战,包括大数据集问题、数据复杂性问题以及数据动态增长的问题。解决的思路,是研究分布式并行计算环境下的大数据分析挖掘的基本策略、复杂度降低精度可控的算法以及集成算法构建大数据挖掘平台。
春雨移动健康创始人张锐
春雨移动健康CEO张锐主要分享了具体应用领域里面如何操作健康大数据,他具体分析了数字医疗核心——EHR。通过数据采集对数据监督,然后对数据进行干预。这是数字医疗方面的基本范式。他讲到EHR有四个方面:实时健康流数据,历时疾病数据,节点健康水平数据和健康消费行为数据。 其中,实时健康流数据主要采集的是人体心率、心电、血压、血糖、运动、体温、呼吸等生命体征数据,主要是来自可穿戴设备等。历时疾病数据来自各医院,但由于信息孤岛,有很大的应用障碍。 节点健康水平数据比如每年的体检数据。
他指出EHR给现代医学带来的变化,首先是从看医生到医生看你,从医生中心到用户中心,从医院中心到客厅中心,从治病挣钱到防病挣钱。并表示目前还有一些问题需要解决,比如中国用户EHR数据画像,EHR上下游硬件和EHR接口标准等。
考拉征信首席技术官葛伟平
考拉征信首席技术官葛伟平首先分享征信与数据的关系。他认为,数据和征信密不可分。数据是征信的基础,然后他分享在大数据以及其应用方面的一些体验:
在全体讨论环节,各位专家针对现场听众的问题作了详细的解答。
一位听众针对个人隐私方面,提出了在整合数据怎么处理数据边界以及关于隐私方面的交集的问题。
考拉征信首席技术官葛伟平回答:征信公司严格来讲它是第三方机构,它数据来源于第三方,为第三方服务。例如,考拉征信的数据更多来源于股东数据,并经过多种方法去隐私。当建模以及真正给用户评分的时候,是需要授权的。涉及到隐私的时候一定要授权,这里存在严格的规定。
来自东南大学的一名老师对于教学过程中和前沿科技存在的差距向在座专家进行了请教。
朱文武回答,老师们整理自己的主线,把一些最核心的技术,比如数据挖掘技术,深度学习技术,讲给学生。第二个脱节问题在语言工具上,他建议现在大学应注重产业界当前使用的工具包,但重点还是在理论和基础方法。
何清认为,老师和学生们要注重走出去多和企业、产业界交流,多参加一些讲座和研讨会。但不要盲目,要冷静思考,多一些原创,多一些创新。
张锐表示,从产业界市场来说,希望学生们注重核心底层和核心技术,需要一个特别冷静诚恳的心,产业界应冷静的去对待学术界,学术界应给予产业界足够的帮助。
更多嘉宾观点,请关注大会直播专题(持续更新中):http://special.csdncms.csdn.net/ccai2015/。
【公告】更多人工智能技术分享与交流,请加入CSDN 人工智能技术交流QQ群,群号:465538150。我们将邀请一线专家进行分享!