犹他大学计算机系终身教授承恒达:人工智能中不确定性的研究 | CCF-GAIR 2018

AI 科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。

在大会第一天的「AI 前沿」专场,美国犹他州立大学计算机系终身教授、电子工程系兼职教授、计算机视觉与模式识别实验室主任承恒达带来了题为「Studying Uncertainty in Artificial Intelligence」的主题演讲。

承恒达教授于 1985 年获得普渡大学电子工程专业博士学位,师从国际著名专家、智能控制学科奠基人、模式识别学科创始人傅京孙(K.S. Fu)教授,他的主要研究方向包括模糊逻辑、计算机视觉、模式识别、图象处理,近年来专注于模式识别基础理论和乳腺癌早期诊断技术的研究。

承教授在演讲中讲解了人工智能中的不确定性,用通俗易懂的例子阐述了这一研究对人工智能领域一系列关键问题的推动意义。

他表示,人们在经典逻辑的基础上发展出微积分、代数、经济学、生物学等一系列学科,但是经典逻辑存在许多悖论,所以需要提出新的逻辑。「经典逻辑的值是 0 和 1,但模糊逻辑不一样,它的值在 0 和 1 之间,能解决一些经典逻辑不能解决的问题。模糊逻辑在科学和工业上也已经得到了许多的应用。」

随后,他进一步讨论了模糊逻辑不能解决的问题,比如两名审稿人评审同一篇学术论文,论文接收的隶属度都是 0.8,可是前者是专家,后者是新人,这两个 0.8 对文章的接收是有不同影响的,但在模糊逻辑下这两者没有区别。把模糊逻辑作为一个子集,在其基础上,发展出新的中智逻辑,就可以进一步解决这些问题。在中智逻辑的基础上,他们对 Neutro Connectedness 进行研究,在这一过程中提出一系列效果极好的算法。他们目前正在与医院和体检中心合作,进行乳腺癌的早期诊断,此外,也在进行多功能道路裂纹检测的相关研究。

以下为承恒达教授的演讲全文,AI 科技评论做了不改变原意的编辑整理。

很多人问我为什么要研究不确定性,原因很简单。不确定性遍存于宇宙中,不同的领域有不同的不确定性,研究不确定性能够很好地解决有关问题,从而得到好的结果。

如何处理不确定性?现在有多种不同的方法,比如说对于随机性可以用概率(probability)来解决,此外还产生了其他的不确定性,因此产生了其它的各种逻辑,如模糊逻辑(fuzzy logic)、粗糙集(rough set)、可能性理论(possibility)等。

建立在经典逻辑基础之上,人们发展出微积分、代数、经济学、生物学等等,可是哥德尔证明了科学是不完备的,经典逻辑存在许多悖论,所以需要提出新的逻辑。

经典逻辑的值是 0 或 1,不是黑就是白。模糊逻辑就不一样,它的值在 0 和 1 之间。比如说你在冰雪道上开车,不可能将刹车踩死或者干脆不踩刹车,所以绝不是按 0,1 这种逻辑来做。当然,模糊逻辑的提出已经得到了许多的应用,比如科学上、工业上,像手机聚焦就是利用模糊逻辑。

模糊逻辑隶属度在 0 和 1 之间,概率也是在 0 和 1 之间。很多人说,那这样的话,概率和模糊逻辑有什么差别?前者是建立在随机性的基础上,后者是建立在精确性的基础上。

举个例子来说明模糊逻辑和概率的不同。假定你在沙漠里必须得喝水才能存活下去,但水被污染了。假定致命水平是 0.4,你需要从两个盒子里选出一瓶水来喝,那你应该从下图中的哪个盒子里选择呢?每盒各有十瓶水,假定第一盒有两瓶被污染了,概率是 0.2,第二盒十瓶水均被污染了,隶属度是 0.2。这时候你应该从第二盒中拿水喝。

如果第一盒有四瓶水被污染,概率是 0.4,而第二盒水被污染的隶属度是 0.4,在这个基础上你从哪个盒子里选呢?从第一个盒子里选还有机会活下来。

所以模糊逻辑和概率是不一样的。如果用模糊逻辑作为一个子集,又可以发展出新的中智逻辑(Neutrosophic logic)。这个新的逻辑包含 I、T、F 三个集合,它们可在 0 和 1 之间取值。

如果从逻辑上看,经典逻辑是 0,1 两个孤立的点,模糊逻辑是一条线,中智逻辑可以考虑成一个球体,能解决一些模糊逻辑解决不了的问题。比如说两名审稿人评审同一篇学术论文,论文接收的隶属度都是 0.8,可是前者是专家,后者是新人,这两个 0.8 对文章的接收是有不同影响的。

可是在模糊逻辑下这两个是没有区别的。如果我们有不确定变量 I(indeterminate),就可以区分这两者。

计算机视觉中存在很多不确定性:

比如由三维到二维变化的过程中存在信息丢失;另外有些定义本身就是模糊的,比如边缘(edge),对比度(image contrast)等;有时候没有一个客观标准来衡量问题,常常采用一些主观方法,比如投票等;用一些词汇来描述差异,比如说热,很热,特别热,一点点热等,这些可以用模糊逻辑解决得很好。

同时在医学影像中,医生可能会进一步引入主观性和模糊性。

1994 年 Fuzzy Connectedness(模糊连接度)被提出,大家知道它在空间理论上有很多应用,在这个理论提出之后,最近我们又提出 Neutro Connectedness(中智连接度),建立在新的中智逻辑基础上。我们基于 SVM 提出了新的 NSVM。大家都知道 K-Means 是经典逻辑很有力的工具,后来在此基础上有研究人员提出 Fuzzy C-Means ,我们又提出 L-Means 工具。

这是我们在发展 Neutro Connectedness 的过程中提出来的一些方法,包括一些运算和运算符,同时我们定义了两点之中的 Neutro Connectedness,公式细节就不多讲了。

我们还从点到点,从点到集合定义了 Connectedness。Connectedness 可以用在图像处理或者一些其他应用上。我们进一步提出 Neutro-connectness Cut,下图是算法的详细过程。

我们也做了实验,下面是实验的数据集以及评估标准等。

下图最上面是原始图像和目标图,如果原始图像离目标图像比较远,可以看到,用以前算法的结果比较差,但我们这个算法能得到比较精确的结果。

下图是另外一个例子,我们的算法用非常少的种子点就可以解决分割问题,当然,种子点越多,结果会越精确。

我们还用图像处理的一些方法来诊断乳腺癌。乳腺癌发病率比较高,在美国,八个妇女中就有一个会得乳腺癌,而且发病率还在增加,但是死亡率却在下降,这是因为美国政府投入了大量的研究经费,来研究乳腺癌的早期诊断。

在中国乳腺癌的发病率和死亡率都在增加,所以早期诊断就成为一个很重要的因素。我们开始研究是用 X 光,但因为 X 光具有放射性,后来我们就转到用超声,超声本身没有放射性,很方便,而且价格低廉,适合普查。除了 X 光,CT 也有一定的放射性,而且 CT 和 MRI 更贵一些,也不适合普查。

但超声图象噪声很大(因为固有噪声),另外质量比较差,同时现在超声科的医生数量大大少于需求。非常有必要建立一个计算机辅助诊断系统,能够检测乳腺癌,帮助医生。我们实际上对这一系统进行了 20 多年的研究。

利用算法可以精确地分辨肿瘤,目前这个系统可以得到比较高的精度,另外也能够帮助医生改进诊断率,提高诊断精度。

因为现在超声科医生很少,可以利用这一系统训练医学院的学生,将学生检测的结果和系统检测的结果进行比较就可以促进学生学习。而且系统能够提供很好的服务,这对于低资源地区和国家极有意义。如果有了这个系统,相当于超声机自带一个经验丰富的医生。在这里我们也用了一些方法来解决不确定性。最近我们正在把系统放在医院和体检中心,和他们做一些合作。

另外,我们做了多功能的道路裂纹检测车,可以全自动检测路面的裂纹。现在,一些单位或机关会先采集图像,再回去手工检测,我们的系统完全可以自动检测。相应的系统还可以用于机场裂纹检测、隧道等场景。

在检测的时候,一定要排除太阳光的影响,要有补光系统,路面噪音也很大,我们也用了一些方法来解决不确定性问题,这时就可以检测出裂纹,然后可以对裂纹进行分类,最后需要进行修补的时候,就可以根据图像来计算需要多少材料,到什么地方去修补等。

虽然中智逻辑用了模糊逻辑做子集,但我认为它也是一个过渡逻辑。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-07-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

为了「理解」什么是对,人工智能还必须「理解」什么是不对

15430
来自专栏机器之心

现场 | CVPR 2018第一天:精彩的Workshop与被中国团队进击的挑战赛

前伯克利 CS 系主任 Jitendra Malik:研究 SLAM 需要结合几何和语义

8210
来自专栏新智元

【Nature 封面论文】随机人工智能群体控制,提高人类协作效率

【新智元导读】噪音,或过程中无意义的信息通常被视为导致麻烦的原因。但最新研究发现,将制造噪音(也即故意做出不协调行为或“捣乱”)的 bot 或 AI 程序放置在...

39180
来自专栏数据派THU

清华大学张长水教授:机器学习和图像识别(附视频、PPT下载)

本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲...

56230
来自专栏新智元

【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚

来源:Reddit 作者:闻菲 【新智元导读】或许你以为搞学术做研究可以不受世俗干扰,殊不知有人在的地方就有江湖。在学术圈,跟对人或许跟做好事情一样重要...

32670
来自专栏AI科技大本营的专栏

四个月速成全栈机器学习?这位黑人小哥三个半月就开始找工作了

程序员转型AI、机器学习需要学多久?1年?3年?这是绝大多数考虑转型的人,从一开始就要认真思考的问题。 光说不练在这里没用,咱们还是要看真实的故事,来看看黑...

38680
来自专栏大数据文摘

注水、占坑、瞎掰:起底机器学习学术圈的那些“伪科学”

一边是今年的NIPS迎来了创纪录的8000多篇投稿,一边是李飞飞、Keras框架的作者François Chollet等大佬摊手承认,机器学习发展已进入瓶颈期。

9700
来自专栏AI科技评论

大神Yann LeCun亲授:如何自学深度学习技术并少走弯路(3000字长文)

编者按:深度学习领域泰斗级人物 Yann LeCun 是 Quora上非常踊跃的答者,他乐于分享自己的心得体会。例如,有人问“你最喜欢的机器学习算法是什么?”,...

45990
来自专栏PPV课数据科学社区

数据挖掘与生活:算法分类和应用

“如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手...

55040
来自专栏机器之心

学界 | Science介绍新型好奇心算法:基于强化学习摸索世界

选自Science 作者:Matthew Hutson 机器之心编译 参与:吴攀、李亚洲 好奇心一直被一些科学家认为是智能的基本属性之一,为机器赋予好奇心自然...

39370

扫码关注云+社区

领取腾讯云代金券