病人是否有生命危险？机器学习告诉你——专访南加州大学终身教授刘燕

用户1737318

发布于 2018-07-20 15:22:19

5870

【编者按】由中国人工智能学会、阿里巴巴以及蚂蚁金服联合主办，CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会（CCAI 2017）将于7月22-23日正式召开。大会第二天下午，刘燕女士将参与【人工智能科学与艺术论坛】，分享她在人工智能与艺术结合方面的一些看法。

从早前的语音识别到后来围棋中的人机大战，人工智能技术早已不是“天边的云彩”，遥不可及，而是更多的落地于生活，解决很多具体的问题。机器学习作为实现人工智能的方法，使用机器学习训练的模型广泛应用于复杂系统的预测问题，股市的涨跌，是否会发生自然灾害等这些通常凭借“经验”判断的问题统统可以使用机器学习来达到更加准确的预测。而这一切，都绕不开对于数据的分析研究。

CCAI大会前夕，CSDN专访了南加州大学计算机系终身教授、机器学习中心主任刘燕，她的主要研究项目是时间序列和时空序列数据的分析与学习，我们就机器学习在医疗中的应用以及一些机器学习中的分析方法进行了请教。

刘燕，南加州大学计算机系终身教授、机器学习中心主任。她在卡内基梅隆大学获得计算机硕士及博士学位。2006年-2010年在IBM研究院担任研究员。她的主要研究项目是时间序列和时空序列数据的分析与学习，曾经多次组织该课题的研讨会和邀请讲座。研究成果被广泛应用到交通预测、医疗、环境、智能生产和其他领域中。她曾经获得美国国家科学基金会奖、大川基础研究奖、ACM论文奖荣誉奖（全球计算机博士论文最高奖项）、暹罗数据挖掘国际会议最佳论文奖，以及雅虎、IBM、Facebook学院奖。

以下为采访实录：

CSDN：首先请与我们的读者分享一下您所关注的技术领域以及目前正在研究的方向。

刘燕：我现在主要研究两个方面，一是有关人工智能的基础研究，它包括两个方向：可解释性的机器学习以及迁移学习。机器学习大部分的方法都把算法看成是黑匣子，非技术人员不能了解机器学习的算法是如何产生这样的结果的，我们希望提供一个可解释性的同时准确率高的机器学习办法。迁移学习在基础的人工智能研究里是个很大的领域，我们平时在封闭的环境里做算法研究，然后把这些算法放到实际的应用中，会发现应用中数据的统计分布和用来给机器学习的数据不太一样，这其中就涉及迁移学习的问题。

二是有关人工智能应用的研究，我们主要是应用在医疗方面，医疗上目前有很多尚未解决的问题，我们希望通过分析医疗大数据，得到一个机器学习模型，帮助医生解决实际问题。另一方面是智能交通和数字城市，通过大数据有效地预测交通，做环境、电力网络等调度，将城市变成一个数字城市，让城市更加聪明。

机器学习在医疗领域的应用

CSDN：您在时间、时空序列的分析与学习课题上的研究成果已经被应用到交通预测、医疗、环境等领域，那么就医疗领域来讲，时间序列和时空序列的研究解决了哪些具体的问题，实际应用中，预测的准确率为多少？

刘燕：有关时间序列或是时空序列在医疗方面的研究，我们做了四个方面：

急诊室病人病情的预测。收集到病人有关时间序列的一些基础数据，如病人的体温、心率、血氧量等之后，我们用深度学习的方法预测这些患者在急诊室里的病情，比如病人是否还需要呼吸机，病人在24小时内是否有生命危险等。我们主要是做这些在急诊室里的数据分析，看病人的健康状况，帮助医生做诊断以及治疗。对于病人未来24小时之内是否有生命危险的判断，我们的研究已经能够达到80%-90%的准确率，相比现在最先进的技术，准确率有20%-30%的提高。
癌症患者生存时间的预测。我们通过机器学习的办法，主要是利用深度网络学习，分析以前病人的数据，判断该病人的生存时间是多少。
糖尿病患者行为的预测。像糖尿病这种长期的病，我们通过测血糖的仪器或者可穿戴设备获取病人日常行为的时间序列数据，通过分析去控制患者病人的饮食情况和运动情况。
止痛药的剂量判断。常用的止痛药如果给病人用的剂量太小，病人会感觉疼痛，剂量太大病人可能会上瘾，我们需要预测基于这个病人最合适的止痛药剂量，并根据每个人的情况提供一个个性化的止痛药剂量的研究。

CSDN：您曾在一次深度学习于医疗领域中的应用分享中提到DNN（Deep Neural Networks 深度神经网络）+GRU（Gated Cycle Unit 门控循环单元）深度学习模型，这两种模型的组合式如何提出的？

刘燕：这主要是一系列有关用深度学习方法去处理医疗数据的研究。医疗数据里有不同的数据类型，比如急诊室里收集的时间序列数据，病人的年龄、体重、病史等健康数据，还有医疗影像等数据。如果你想用到病人的病史信息，又想用到病人在急诊室里的时间序列信息，我们需要把这两种类型的数据放在一起研究，这样能够给我们提供更全面的有关病人健康的研究。

在这个模型里，我们用DNN去处理病人过去的病史以及一些实验数据，通过GRU处理时间序列，把这两种放在一起，相当于我们把不同类型的数据放在这个机器学习的模型里去考虑，这样就能够得到很好的效果。

机器学习方法论

CSDN：时间序列分析是定量预测的方法之一，那么多少数量级数据的分析结果值得参考？在有大量数据的情况下，又该如何选择合适的模型？在此过程中通常有哪些难点？

刘燕：根据不同的情况，可能有非常不同的答案。因为在时间序列里面，很重要的问题是数据会变化，数据的统计分布也会随着时间而变化。如果它的变化比较小，或者说基本不变，大概需要上万个数据点就能让机器学习模型学习的很好。如果数据的统计概率是随着时间而变化的，如金融方面股票的预测，它的概率分布变化非常快，这是非常难的一个预测，很难讲需要多少数据。

在有大量数据的情况下，以前的统计方法主要是ARIMA（Autoregressive Integrated Moving Average Model 自回归积分滑动平均模型），ARIMA是统计里应用最多的有关时间序列预测的模型。现在随着大家对深度学习的研究了解，比较统一的认为，深度学习办法是现在能够得到的最好的机器学习用于时间序列的办法。

在时间序列的收集和分析中，可能会遇到一些较难攻坚的难题：

数据收集不完全。例如在急诊室中，如果有些机械报警，护士会将传感器从病人身上拿下来，这样就无法收集到病人在这个时间的数据。又比如在交通方面，某一段路程行驶过程中，驾驶员的手机信号不好，那么在此过程中，就收集不到驾驶员走的哪条路径的信息，这样我们收集到的数据，就不是一个完整的顺序。这时我们需要一些比较好的算法，去弥补这些看不到的数据，这样才能做更好的预测；
时间数据的收集频次不同。例如在城市中，通过不同的传感器去收集一些数据，温度数据可能每一分钟就会收集一次，但电网的使用情况可能只能每十分钟收集一次，这种多频率的时间序列的分析，现有的方法还不能很好解决，这也是现有最大的难题；
数据迁移。在时间数据的分析里，数据迁移是非常普遍的，但现有的模型还不能够做的很好。

CSDN：Granger因果关系检测是研究两个变量是否存在因果关系的常用方法，我注意到您其中一个研究领域就是时间因果模型，那么您基于Granger因果关系模型有哪些创新？

刘燕： Granger因果关系模型是我们过去五年主要研究的一个课题，我们提出了Granger图模型，它主要做了两方面创新。

速度上，降低算法复杂度。此前Granger因果关系需要检测的时候，它的算法复杂度是N²（N代表时间序列的数量），经过我们的创新之后能够线性降低时间复杂度。
统计上，降低数据复杂度。此前有N个时间序列时，需要很多数据才能检测到Granger因果关系，我们做的一项理论证明，我们的方法能够把数据复杂度降低，使得只需要极少部分的数据就能解决很大的时间序列。

以上的这些创新，主要应用到了全球变暖的原因分析，基因调控网络（regulatory network）以及社交网络上。

CSDN：在机器学习中，通常有很多模型可以选择，当构建了模型，需要使用一些历史数据来帮助机器学习算法学习一组数特征与预测输出之间的关系。但即使这个模型能够准确的预测历史数据，该如何知道该模型对新的数据有效呢？

刘燕：现有数据情况下，我们可以使用检测的办法，使用现有的数据去预测将来发生的情况，会有一个估值，往往比较乐观。

实际应用中，会遇到数据迁移的问题，如何判断模型是不是对新的数据有效，大概分为以下两点：

预测之后，跟实际观测的结果比较，看它们是不是不一样；
看是否有一个统计概率的迁移，如果能够看到一个迁移的改变点，就可以发现数据统计概率的改变。

但总体来说没有一个特别好的解决方案，因为可能会存在不规则点。可能数据概率并没有变化，但观测的点和之前就是不太一样，这些情况下很难预测，也很难判断它是一个不规则点还是概率发生了迁移。

目前这个问题没有特别好的解决方案，但是有些比较初级的解决办法，被广泛应用到现在的很多应用中，这也是未来的研究课题。

CSDN：时间序列和时空序列的分析方法在本质上有何不同？

刘燕：时间序列，相对来讲是一个一维的数据，只考虑一个方面，就是时间方向。而空间序列，它相对来讲是考虑到多维方向的有序数字。时间是一维的序列，空间相当于两个序列，这三个之间建立了一个三维的序列。从一维到三维，复杂度是随着指数级增长的，因此从时间序列到时空序列，其算法复杂度和运行复杂度是成指数增长的一个难题。

CSDN：对于想进入机器学习领域的开发者而言，他们必须具备哪些技能？

刘燕：在深度学习领域，从开发者角度有几个方面。对于想要对深度学习算法本身改进的开发者，要有统计以及强大的数学知识支持，包括离散数学、数学理论等，同时我觉得也需要对于编程方面的需求，因为从算法，到真正的开发，有很多的考量，如统计、数学背景、编程等。

如果开发者想要将深度学习模型应用于解决实际问题，现在有非常多的开源软件，已经构成了很好的平台，通过现有的开源软件，在上面进行一些改建，得到很好的效果。很多时候可能对于统计或者数学方面的研究不需要特别多。

总体上讲还是要看开发者从哪些方面着手，想从深度学习，基础研究角度来切入，还是想从应用方面来切入，需要的技能也是不一样的。

关于CCAI 2017

CSDN：在本次大会中，您将于其他6位女性专家共同参与【人工智能科学与艺术】论坛的讨论，您对于人工智能与艺术的结合有哪些独到的观点？

刘燕：我可以分享一下我要跟大家共享的一些观点。目前大家在人工智能方面已经取得了比较振奋人心的成果，但我觉得也有很多方面还没有完善，在下一步，有很多难题需要去研究。一方面是可解释性的人工智能模型，例如人脑是没办法解释我们怎样创作艺术的，或者说是一个灵感，灵感到底是什么呢？机器现在也没有一个很好的解释。如果通过人工智能的办法，通过可解释的人工智能学习，我们有可能可以帮助人类解释灵感是什么，这样可以更好地帮助人类开发灵感，去创造更好的艺术。

另一方面，我觉得是人工智能的泛化性。现在人工智能在艺术方面的应用，主要是模仿人类，比如机器可以创作和莫扎特曲目很像的一段音乐，但并没有达到一个上升成果，创造一些和以前不一样的创新性的艺术。因为机器学习还是通过大规模的数据学习，去模仿现有的艺术。如果这个泛化性能够做的很好，就能让机器创造一些没有创造过的东西，这可能会激发人类创作的思维。从这些角度来讲，这也是一个比较难的研究问题，但是我想也是人工智能与艺术方面将来发展的道路上必须解决的一个问题。

CSDN：在本次CCAI大会上，您对哪些内容比较感兴趣？

刘燕：在这次大会上，我看到会有很多不同方面的探究和探讨。有一些和我们的研究方向可能比较一致：一方面是人工智能基础性的研究，比如迁移学习，可扩展性基础研究等。另一方面是人工智能的应用，像医疗、智慧交通，以及人工智能用于金融方面的研究，都是我比较感兴趣的。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-07-21，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自人工智能头条微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度