语义学习-通用智能的切入点

《思想本质》一书通过语言和认知对人的思想认知等进行了分析,前部分有一个核心观点是(李德毅院士也提过):语言是认知的语义索引,语言只是符号,语言表达的含义即语言背后的认知体系是决定语言的根本。

语言是语义索引,背后有一个很大的认知体系为基础,认知基础之一来自视觉对现实世界的认识,物理规律,场景的学习理解,长时间维度时间的记忆理解及社会互动理解。

语义认知单位是人类思维的基本元素,人思考的概念,基础概念都是一个基本的语义单位,人智慧高于其他动物就是因为人的抽象思维层次更高,思维活动是在语义认知层面进行思维。所以现在如果做通用人工智能应该从视觉开始,语言其次;首先通过视觉对外部世界达到语义认识,然后在语义认识的基础之上进行思维,进行其他认识活动的构建。

deepmind也有类似思路,见deepmind 做通用人工智能的思路,及理论 | 暑期课程最后一讲:理论神经科学和深度学习理论,且现在的深度网络已经可以学习语义特征,只是技术还非常原始初级。ref谷歌:beta-vae 可以媲美infogan的无监督学习框架-多图-及代码; 使用infogan学习可解释的隐变量特征学习-及代码示例(代码和官方有差异)

上面链接展示的语义认知,还仅限于静态图像,视频中跨时间维度的如动作等事件抽象还没有做到。链接里面展示的学习到的抽象语义包括:人脸微笑发型等、椅子宽窄的概念属性,mnist数字粗细的概念属性。

感知作为外部信息输入的第一步,作用是抽取核心语义特征属性。高层次的逻辑判断基于底层的基本语义单位的认知元素。比如翻译就是对同一事件的不用语言描述,事件是唯一认知,描述可以用不同语言描述,不同语言的描述都是基于同一事件的多个元素的认知对应。

思考运算基于物体的核心属性推理 ref deepmind 做通用人工智能的思路

拿驾驶来说

驾驶的核心是认路,路的概念是核心,路的方向是驾驶的根本。

路的一个属性是路的延伸方向,驾驶的核心既是控制车辆的前进的方向跟路的延伸方向相同即可,暂不考虑其他状况。

不同场景路对应不同的概念,比如城市中的路概念对应"街道"。街道的概念其实有很多的相关概念:行人、建筑、交通标识、路口等等。为了理解街道的概念需要以上相关概念的学习。当然概念的学习是一个渐进的过程,概念可以分化,细化。

深度学习学习到的概念如果能类似人实时改进学习提高,且不同的概念能及时学习提高,快速适应环境变化,这样才能有更好的适应能力。

考虑概念的层级组合关系,子概念的概念学习可以在不影响架构的情况下,直接提高系统的认知能力。

传统自动驾驶软件如果将各种条件提前做好配置,则失去了不同环境的适应能力。

现存技术障碍:语义学习技术处于非常初级阶段,模型的稳定性,扩展性,训练模型结合其他功能的协调,如和动作控制进行结合,属性的相关操作比如手臂的协调控制指示等,注意力等。

语义学习可以从beta VAE入手 ref 谷歌:beta-vae 可以媲美infogan的无监督学习框架-多图-及代码;

欢迎大家多交流,一起推进。

关于我:微信zdx3578;createamind公众号菜单可以了解更多

APPENDIX:

为什么视觉重要:

视觉是动物对世界认识极其重要的一个入口,通过视觉,动物对世界进行认识,把世界在自己的大脑中进行建模。

视觉无论从生物的进化,还是从个体生物的发育来看,视觉都是基础,其他的思维很大比例都是构建在视觉基础之上,很多语言都是首先反映普通的视觉对象,抽象词语也大都是从具体的词语抽象而来

智慧的高低是抽象思维的深度,是理解概念的抽象深度,概念最基础的应该是具体的物体的概念,视觉层次的物体形体概念,

人比其他动物更强的是大脑的其他高级功能更多更抽象,视觉神经系统相比其他感觉系统在整个大脑中所占比重也更大。

动物视觉,人类视觉思维,人类高级思维

实现方法的深刻认识:才是改变未来的能力!向大自然已经实现的智能学习:动物的认知神经发育发展过程,这样实现过程才是有一定保证的。

在与世界的互动水平上面反映了地球生物的智能水平,对这个世界认识越深刻那么这个生物越智能。人作为这个世界最高智慧生物,学习人的认知发展不会导致类人智能的研发出现很大的偏差。

想更智能就要对世界有更深入的认识,想真正的认识世界,需要从最底层开始认识这个世界,从最底层开始构建对世界的认知,像一个新生婴儿,甚至更早的小婴儿一样开始认识世界,积累对世界的认识

反观生物对世界认知的发展进化,发育演化,视觉是认识世界的重要基础。

视觉是动物对世界认识极其重要的一个入口,通过视觉,动物对世界进行认识,把世界在自己的大脑中进行建模。视觉神经系统在整个大脑中所占比重很大。

视觉无论从生物的进化,还是从个体生物的发育来看,视觉都是基础,其他的思维很大比例都是构建在视觉基础之上,很多语言都是首先反映普通的视觉对象,抽象词语也大都是从具体的词语抽象而来

智慧的高低是抽象思维的深度,是理解概念的抽象深度,最基础的概念是具体的物体的概念,视觉中具体物体的形体概念,

原文发布于微信公众号 - CreateAMind(createamind)

原文发表时间:2016-11-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

经验谈:数据挖掘七步走

Step1.商业理解 就是商业问题的理解了,那么如何更好的理解“老大”提出的商业问题困惑呢?我觉得思维导图倒是个不错的选择,当然自己要想更好的理解“老大”的意思...

2905
来自专栏AI科技评论

业界 | 黄仁勋亲自撰文怼上 TPU:P40速度比你快 2 倍,带宽是你的 10 倍

AI科技评论按:前不久谷歌发布了关于TPU细节的论文,称“TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍”。当时就有人对此种“比较”表示质...

3636
来自专栏AI研习社

F8 2017 | 技术负责人为你解析 Facebook 神经机器翻译

编者按:该讲座主题为 Facebook 机器翻译的两代架构以及技术挑战。 在昨日的 F8 会场,该讲座吸引了众多开发者到场,主讲者是 Facebook 语言翻译...

34911
来自专栏AI科技评论

动态 | 微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

7月9日,由CCF主办,雷锋网与香港中文大学(深圳)承办的CCF-GAIR 2017全球人工智能与机器人峰会进入了第三天。在CV+专场首场,微软亚洲研究院资深研...

3627
来自专栏人工智能头条

吴恩达教你如何使用“锤子”?机器学习新书免费领

1655
来自专栏机器之心

前沿 | 经典计算的天花板:科学家找到只有量子计算才能解决的问题

Oracle Separation of BQP and PH:https://eccc.weizmann.ac.il/report/2018/107/

1181
来自专栏机器之心

中到英新闻翻译媲美人类,微软机器翻译新突破

机器之心报道 参与:机器之心编辑部 今日,微软研究团队表示,微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心,他们...

2875
来自专栏量子位

MIT联手IBM发布超大数据集:100多万短视频,多维度标注

Root 编译整理 量子位 出品 | 公众号 QbitAI 除了CV、NLP、无人驾驶,AI的下一个热门方向是什么? 视频行为理解。 现在,对于AI来说,识别静...

3639
来自专栏BestSDK

谷歌又玩黑科技,DeepMind可以模仿人类说话

Google的DeepMind研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet。该语音合成系统能够模仿人类的声音,生成的原始音频质量优于目...

3028
来自专栏量子位

机器学习到底能替人干哪些工作?《科学》列出了8条评估标准

唐旭 编译整理 量子位 出品 | 公众号 QbitAI ? 对于AI会取代哪些人类工作的猜测,也许可以暂时停一停了。 最近,两位来自MIT和CMU的研究者在一篇...

4158

扫码关注云+社区

领取腾讯云代金券