首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

言和语的关系及其测序定位

《新版融智学》第一章 言和语的关系数据库,形式化理解,全球语言定位系统 GLPS

目录

第一节 言和语的关系

第二节 言和语的形式化理解

第三节 言和语的关系数据库

言和语的分类

言和语的形式化理论模型

第一节 言和语的关系

言和语的定义及其相互关系的理论模型

言即单音节的字

基本结构单位

语即混音节字组

派生结构单位

类1:自然语言

类2:机器语言

图1-1. 言和语的关系在系统工程融智学特有的双重形式化数据库里展现并可检验

导读:语言学创立者索绪尔不仅区分了语言和言语,而且还发现了语言与棋的系统相似性。这不仅为融智学奠定了再进一步区分言和语的理论基础,而且还为汉字棋和数字棋的结合而形成的双字棋发挥了积极的启迪作用。智能化双字棋盘软件(三类双语应用场景)将在第三章专门系统地来介绍。

言和语

人机各自的语言特点

言和语的关系(人类语言有组字成语的典例:汉字汉语)

人机交互界面

最优化字库原理

线串型结构的字

层面型结构的字

言(单音节的字)和语(混音节的字组)的关系(结构化)数据

第二节 言和语的形式化理解

导读:形式语言学和形式语义学先驱塔斯基区分了对象语言与解释语言或元语言。这启迪融智学创立了言和语的形式化理论。首先以汉字汉语为例,把单音节的言即汉字,视为对象语言;进而,把混音节的语即汉语,视为解释语言即一系列的元语言。结合克莱尼小字符串的形式理论,及其典型实例,融智学定义了汉字汉语和数字数据的广义文本及广义双语。为后续定义孪生图灵机暨形式化理解模型奠定了基础。

(间接形式化)基本的言(单音节的字即对象语言)和派生的语(混音节的语即解释语言或元语言)

人机各自的特征

第二节 言和语的形式化理解

导读:形式语言学和形式语义学先驱塔斯基区分了对象语言与解释语言或元语言。这启迪融智学创立了言和语的形式化理论。首先以汉字汉语为例,把单音节的言即汉字,视为对象语言;进而,把混音节的语即汉语,视为解释语言即一系列的元语言。结合克莱尼小字符串的形式理论,及其典型示例,融智学定义了汉字汉语和数字数据的广义文本及广义双语。为后续定义孪生图灵机暨形式化理解模型奠定了基础。

(间接形式化)基本的言(单音节的字即对象语言)和派生的语(混音节的语即解释语言或元语言)

形式化理解的双重形式化特点

图1-2a. 言和语的形式化理解(结合图1-1理解其双重形式化特点):宏微贯通

由图1-2a可见,言和语的形式化理解,首先是对双重形式化特点的理解。进而,才便于对微观的言和语的关系数据库的理解(见图1-1)。最后才便于宏观地理解全称量词符号“∀”和存在量词符号“∃”分别用于对狭义及广义的言和语的具体符号形式的枚举表示。其中,A库即全球语言定位系统(GLPS)是打通各种进制之间符号体系相互转换的关键或枢纽(第三节连贯起来讲)。

形式化理解

宏微贯通

图1-2b. 言和语的形式化理解(核心是算术数字与中文汉字的类定义):宏微贯通

由图1-2b可见,言和语的形式化理解,涉及宏微贯通的颠覆性创新。全称量词∀x=n记录所有汉字的ID构成的集合,正好与P进制的数字集合等价。这样的假设,已在言和语的关系数据库中验证并证成,由此得到了全球语言定位系统(GLPS),其特点是宏微贯通。简单地说,就是算术数字与中文汉字的类定义在言和语的关系数据库里的示例均可枚举。至于图1-2b所示左右两方面分别对应于内容信息和形式信息,忽略它们就会陷入语义泥潭,即遭遇最大的歧义而难以区分(试问:方方面面的专家都区分不了的语义内容分歧,如何让AI区分?何况AI擅长的是语义形式信息处理,因为,本质上AI只能做到形式化理解)。提示:语法形式和语义形式具有一致性,但在内容上却不具有!

第三节 言和语的关系数据库

导读:在计算机辅助信息处理不仅在中文信息处理过程中,而且在字式图表音像立活八大形式的信息处理过程中,都有结构化、半结构化和非结构化三类大数据,其中电子表格或结构化数据库是本研究关注的焦点。例如我亲自实操建构暨做出来的言和语的关系数据库,就用到了前述三节导读的关键内容。

宏微贯通

全球语言定位系统

总库即全球语言定位系统(GLPS)

分库可按各级各类教育的识字量设定

如果说识字量是基础,那么,词汇量

和短语以及各类术语乃至俗语的数量,

在形式上就是派生的,因而,可自动化

生成(与采集的匹配即可统计学习)。

图1-3. 言和语的关系数据库(全局示例独立完成)及应用(局部示例经过多类研究验证)

由图1-3可见,全球语言定位系统(GLPS)不仅是基础,而且,还是枢纽,是关键。因为它的调用即可通过人机交互协作而建构出全球知识定位系统(GKPS)和全球软件定位系统(GSPS)-它们将在接下来的第二章和第三章分别加以介绍。把语言、知识、软件视为脑智的2+3三重性这项颠覆性创新就在于:它不仅颠覆了旧脑智观,而且颠覆了旧软硬件观。

全球语言定位系统(GLPS)

参考文献

[1]邹 晓 辉.字本位与中文信息处理 ——解析"字与字组的关系"探索"汉语形式化"新路 ( 典 型 实 例 : 由 " 一 字 精 解 " 到 " 字 字 精 解 "). 清华科技园.

[2]邹晓辉, 邹顺鹏. 字与词的义项分析 ——论汉语研究的逻辑起点.

(与其说是字本位,不如说是言本位)2009会议发言,2013年北京大学出版社出版

[3]邹晓辉, 邹顺鹏. 一种基于双语自动转换的间接形式化方法:.

[4]邹晓辉, 邹顺鹏. 间接计算模型和间接形式化方法[J]. 软件, 2011, 32(5):5.

[5]邹晓辉, 王肖群, 邹顺鹏. 大数据与人机对话:语必在言的集合里选取[J]. 计算机应用与软件, 2019, 36(9):6.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230219A030OR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券