MathWorks赵志宏:借助迁移学习和自动标注,解决AI模型训练中的两大难题

两年之前,人工智能被谷歌引爆。时至今日,人工智能可谓无人不知,无人不晓,彻底火了,而基于AI的创业公司,也如雨后春笋般成长起了。

提到人工智能,就不得不说其背后的数据和算法。实际上,人工智能的根本是大数据、物联网和云计算等技术的落地,是通过对大量数据的模拟训练,让人工智能模型更接加接近于实际需求。因此,离开数据和算法,人工智能就无法真正落地。不过,对于很多企业来讲,在人工智能的训练中都会遇到两个方面的挑战:一是数量据不够如何进行查勘型的训练;二是如果数据量太多,如果快速进行标注。如何解决这些难题,MathWorks给出了答案。在近期召开的MATLAB EXPO 2018大会上,MathWorks产品市场经理赵志宏带来了主题为《工智能 & 你,准备好了吗?》的分享,就企业在人工智能模型训练中存在的两大主要难题进行了分析,并带来了MathWorks的解决方案。

MathWorks产品市场经理赵志宏

利用迁移学习的方法,通过模型产生数据训练神经网络

数据是人工智能训练模型的根本。在人工智能的开发过程中,首先要采集大量的数据,然后通过这些数据进行模型的训练。对于很多公司来讲,他们并不具备数据采集的能力,尤其是初创公司,如何在没有数据的情况下也能够训练出很好的模型呢? MathWorks提出了迁移学习的模型训练方案。

MathWorks产品市场经理赵志宏在接受记者采访时表示,“数据、输出和模型是整个AI开发流程的一个步骤。如果开发者想做人工智能,又没有太多的数据,可以采用迁移学习的方法。

何为迁移学习?以通过人工智能的方式来预测风力发电机的故障为例,用户不能等到采集到大量故障数据以后再预测,这样不符合设备维护的目标,而是先用Simulink模型建立一个风里发电机的模型,通过校正让这个模型非常接近风力发电机,然后通过该模型产生故障数据,进而训练机器学习或者深度学习的神经网络。

赵志宏表示,很多场景下的数据是很难收集到的,例如绝对不可能故意让风力发电机发生故障去测取数据,也绝对不能故意制造一起交通事故来测取自动驾驶的数据,在这种情况下利用基于模型的设计方法就非常有用了。

他表示,基于模型的设计方法有一个很大的优势,就是其中的一个步骤要在真正做出产品之前建好一个模型,这个模型要跟这个产品非常接近,不管是从数字计算或是行为产生出来的结果,都要跟真正的结果非常接近。所以,很多时候工程师在设计产品的时候已经把这个模型建好了。在这个模型的基础上,如果想要去产生有故障时候的数据,那只需要在这个模型上加入一些故障的情况,这就比在实际设备上产生故障要容易的多。

赵志宏同时强调,把故障加入之后产生出的数据到底好还是坏,至少要经过一些人工的验证和检测。所以,这里所指的没有数据,并不是说一个数据也没有。也许,有一次故障或者两次故障的记录就可以去验证产生出来的数据跟已经有的非常稀罕的数据进行比较,看看产生出来的数据是不是符合情况。如果是符合的,那就增加了信心,那么通过模型产生出来的数据可以进行AI的开发。如果不符合,也就证明模型还需要进行进一步的调整。

通过深度学习技术,对大数据完成自动标注

随着传感器的大量采用,数据量进入洪荒时代,给人工智能进行特征标记带来困难,这时候可以采用深度学习进行标记。赵志宏表示,数据量特别大也会带来一个问题,就是想把数据标志出来特别困难。而通过MATLAB的自动标志数据功能,可以帮助企业解决数据量大的问题。他强调 ,这个标注可以避免人工去进行标注,节省大量的时间和成本。

赵志宏先生解释,“深度学习的特点是不需要人工手动找出特征值,系统可以自动从数据里提取特征值。MATLAB里面有很多自动标记的工具和功能。LiDAR三维点云技术可以对每一点进行标注,把这个点聚类在一起聚成一个目标模型,然后再把目标具体代表的实物辨别出来。有些用户已经采用MATLAB的工具进行了开发,著名的汽车配件公司AUTOLIV就在用这种方式进行自动数据标注。”

以膨化食品智能检测为例,研究人员可以在用户咬食品的时候提取特征,用咬合声音和咬合力度衡量食品的松脆度,有了这两个特征,还需要开发一个机器学习的分类器,而MATLAB提供了分类学习器。开发者通过这个工具不需要一个一个去试各种分类器的算法,使用MATLAB提供的APP去一次性尝试所有算法。开始运行APP后,用户选好数据和需要训练的分类器,然后进行训练。在训练过程中,用户可以看到每个分类器的整体结果,选择精确度最高的一个,然后进行更多的调查和研究。如果用户没有研究过AI,可以用MATLAB提供的APP进行学习,去尝试所有机器学习的算法。

在MATLAB里面做深度学习难吗?用赵志宏先生的话说,只需要写5行的MATLAB代码,用户就可以建出一个能够识别食品的网络。笔者已经多年没接触过MATLAB了,所以无从考证,工程师朋友们如果需要可以进行尝试。【责任编辑:张诚 TEL:(010)68476606】

  • 发表于:
  • 原文链接http://news.51cto.com/art/201806/575581.htm
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券