《语言的维度》自序

马上科普尚尚

发布于 2020-05-14 15:29:13

4010

发布于 2020-05-14 15:29:13

从事科学研究20余年，年纪渐大，有时禁不住要回忆以往。想当初刚刚博士毕业，意气风发，豪情满怀，放眼四周，青山绿水。即使偶遇冰霜飓风，也总是相信世界本质上还是好的。即使世界有时表现的不那么好，也总是相信，那只是暂时状态。那些不好的状态，终究会被人们变革掉。基于这种素朴的生活信念，进入了机器学习研究领域。据此，对于机器学习系统的一个基本假设就是: 一个理想的机器学习系统，其最坏的状态不应该是该系统的稳定状态。多么幸运，这个假设确实可以用来研究软聚类算法的参数选择问题, 得到的相关研究结果已经在TPAMI、CVPR 等期刊会议上发表。

时间飞逝，转眼中年，多经世事。当头上的黑发开始脱落，身材开始走形，才明白：改变外在的自己有时很容易，甚至不需要自己努力。改变内在的自己却是很难很难，即使付出许多汗水也未必能够做到。本质上，使自己变好一些，真的很难很难。如果只满足于对状态换个标签或者名字，有时就没有那么难。世上这类事情太多太多，生活中比比皆是，比如：将蛇称为龙，猫称为虎，鸡称为凤，白水称为琼浆，樱桃称为车厘子，等等。因此，只希望名实相符，好就是好，坏就是坏。由此研究机器学习，基本的假设即为: 一个理想的机器学习系统应该归哪类，像哪类；像哪类，归哪类。据此，得出了机器学习的公理体系，统一了学习算法的设计准则，在清华大学出版社印行了一本学术专著《机器学习：从公理到算法》。

时间从来不为任何人停留。而今，身不由己，踏上了知天命之年的快车道。生活中有太多的无奈。画家齐白石曾经说过，“作画妙在似与不似之间，太似为媚俗”不似为欺世”。年青时以为他说的就是作画，如今才明白，这岂止于作画。人在江湖，要做到像机器一样有一是一、有二是二，对于我这样一个俗人，几乎不可能。机器毕竟是机器，既不考虑尊严和脸面，也不担忧生命和生活。终于明白人和机器毕竟不同，在生活中努力随遇而安。到什么山上唱什么歌，见什么人说什么话，这境界超出能力，只能向往。

可生活毕竟是生活，从来也不曾因人无能就放行。赶鸭子上架也罢，按牛头喝水也罢，有时也不得不在现实中说一套、做一套、想一套。虽然这样的事情不多，却严重冲击个人三观，让人身心撕裂，有时甚至痛不欲生。正是这些让人十分难堪的经历，使自己不得不反思，怎么会把事情搞成这样？

反思之后，有两点发现。第一点发现是：个人的修养水平远远不足。具体说来，就是做事手段不行、说话方式不好、思想目的不纯。在一把年纪的时候发现这些，想不尴尬也难。应该说，这些毛病曾经为自己和他人带来了很多的不快，未来也很难说就一定能够避免，为此希望各位新雨旧知能够原谅作为庸人的我，同时恳切期望各位新朋好友在我荒唐的时候能够及时给予批评帮助，使我不断提高个人修养。第二点发现是，语言、事实与心智三者可以各自自成一界，虽然彼此关联却存在各自独立的计算法则。在通常情形下，语言、事实与心智三者彼此之间存在明确而具体的依赖路径；可是也不排除在一些特殊条件下，这三者之间可以弱化、甚至忽略彼此的关联关系。这些发现提供了本书写作的初始动力。

无庸讳言，维特根斯坦也是本书的源头之一。在《逻辑哲学论》里，维特根斯坦曾经言称：“凡是能够说的事情，都能够说清楚，而凡是不能说的事情，就应该沉默”。到了《哲学研究》中，维特根斯坦却写下了如下话语：“我本来是乐于创作出一本好书的。结果事与愿违，但是，我能改进它的时间已经过去”。天才如维特根斯坦，临终时也不得不承认，可以说的事情未必可以说清楚。因此本书并没有过高的期待，只有一个简单的希望：如果思考过这一个问题的人依然觉得有趣，那么本书就算没有白白浪费所消耗的资源，包括读者的宝贵时间、印刷的精美纸张和编辑的认真校对；如果没有思考过这一个问题的人也能从中受益，由于本书中将以可计算的方式论述每个人所感知的词的字面语义、内在语义与外在语义并不一定一致，那么就此恭喜作者的写作水平在停滞多年之后终于有了些许提高，总算爬出了茶壶里煮饺子这一个令人郁闷至极的泥潭。

作者简介

于剑，教授，博士生导师，北京交通大学计算机学院计算机科学系主任，中国计算机学会理事，中国人工智能学会理事，中国人工智能学会机器学习专业委员会常务委员,IEEE会员，International Journal of Fuzzy Systems编委, The Open Artificial Intelligence Journal编委。他主持教育部重点项目、国家自然科学基金等科研项目,参加973项目。 2006年获得霍英东青年教师基金,2006年度入选教育部新世纪优秀人才支持计划。在国内外重要的学术杂志和学术会议上发表过40多篇论文（包括IEEE Trans. On Pattern Analysis and Machine Intelligence, IEEE Trans. On Image Processing，IEEE Trans. on Neural Networks, IEEE Trans. On Fuzzy Systems等），并曾获得第八届北京青年优秀科技论文一等奖。