今年3月9日-15日,在韩国首尔进行的韩国围棋九段棋手李世石与人工智能围棋程序“阿尔法围棋”(AlphaGo)之间的比赛吸引了全人类的关注。3月12日,作为业余五段的崔晓波与棋圣聂卫平、北京葛玉宏道场创始人葛玉宏在北京小米之家一起解说第三局。
到阿尔法围棋下了176手后,李世石投子认负。此时围棋人机大战前三盘人类三连败。作为第三方移动数据服务平台TalkingData的CEO,崔晓波“心情复杂”。但是后来,崔晓波发现,实际上从2014年开始,谷歌已经在中国购买大量的棋谱。后来他到美国拜访所有跟机器学习相关的公司,发现他们有一个共同的地方,就是特别注重数据的积累。“但在人工智能大热的情况下,这一切是被忽略的。”
“我们过大的强调了AI的作用”
被忽略的有两点,1.阿尔法围棋的基础是大量的数据;2.棋谱凝聚了专家智慧,也就是说,阿尔法围棋的数据中其实包含人类智慧。根据TalkingData的数据,我国智能手机13.05亿部,智能手表1200万只,传感器80.54亿个,每人每天手机使用时长3.93小时,可以说,以人为中心的世界正在全速数字化的进程。知道你的手机上有传感器吗?据称手机上隐藏的传感器达16个。不算摄像头、语音,一部手机每天要产生1G的数据。今天,数据以前所未有的速度在产生和发展。
基于数据,才有人工智能的发展。比如谷歌,在语音识别领域取得了很大的进展,原因在于积累的巨量的数据。大量的数据上来后,人工智能怎么识别这个世界?从创业公司来说,虽然大量的公司都在研究机器学习,但,这只是一个开始。感知、识别、认知甚至是预测,不会一蹴而就。“所有的前沿技术,包括人工智能,对世界的感知,还都处于早期阶段。”崔晓波强调:“我们过大的强调了AI的作用。在目前的情况,机器代替人作决策还不会发生。我们还需要引入专家的智慧。”
智能数据时代是什么?
那么,引入专家智慧的大数据时代是什么?怎么引入?
其实,现阶段的“数据”与以往的数据已经有很大不同。数据内容包含的信息量越来越大、维度越来越多,从图像、声音等富媒体数据,逐渐过渡到人的动作、姿态、行为轨迹,再加上地理位置、天气、社会群体行为等等,按照以往处理数据的思路已经难以适应“数据”本身发展的速度。一个融合人类智慧、人工智能以及海量非结构化数据的智能数据时代已经来临。因此,“发展多年的‘大数据’即将进入‘下半场’。”
基于“智能数据时代已经到来”这一判断,TalkingData发布了智能数据平台(SmartDP)——“基于智能数据应用探索商业价值的平台,具有数据管理、数据工程和数据科学的能力”。它包括四个核心部分:数据、技术、咨询、生态。而商业价值是基础。
崔晓波表示,智能数据时代,企业将面临四个方面的挑战:
1.业务数据化。所有业务都以数据的形式进行流转。
2.数据资产化。在很多企业,业务与运营没有形成闭环;数据没有资产化,只是先储存起来而已。智能数据时代,会倒过来,业务可能不赚钱,但数据将体现出商业价值。
3.应用场景化。企业与用户的每一个交互点,都具有改变用户认知的功能,因此场景化将成为营销的核心。
4.技术开源化。据不完全统计,目前中国有130家做大数据的公司;而美国有7000家,虽然是红海,但由于产业环境良好,依然有发展空间。
为了促进大数据产业的发展,崔晓波发布了两项重要的框架开源:Myna和Fregata。
Myna是基于物联网的数据采集工具,预制了人工属性,具有情境感知功能,与国外的同类技术相比,效率可以提高三倍,并且耗电低;Fregata是一种机器学习引擎,可以根据容量自动调整参数,提高模型加载速度,根据测试,十个节点内存加速的情况下,可以在十秒钟之内完成整个训练过程。