导读:当描述一门编程语言的时候,我们一般需要区分它是动态类型还是静态类型,区分它是强类型还是弱类型。然而,很多人会将这几种类型搞错。本文的目的就是来辨析清楚这四种类型。文中涉及多种编程语言的比对,主要介绍的是各编程语言的共性话题,希望能给你带来一些启发。
作者:mrcode
原题:通俗的方式理解动态类型,静态类型;强类型,弱类型
链接:https://segmentfault.com/a/1190000012372372
(本文经原作者授权转载,略有改动)
今天和一个朋友讨论 C++ 是强类型还是弱类型的时候,他告诉我 C++ 是强类型的,他和我说因为 C++ 在写的时候需要 int,float 等等关键字去定义变量,因此 C++ 是强类型的,我告诉他 C++ 是弱类型的,他竟然还嘲笑我不懂基础。
我又尝试去问了另外一个同学 Python 是强类型还是弱类型的时候,得到的竟然是弱类型,就因为定义变量没有 int,float!
然后我想找一些网上的资料试图告诉他们他们是错的(我是对的),结果发现网上的资料大多为了严谨结果把简单的问题(其实并不简单)说的很复杂。比如:知乎上的一些 回答。所以用通俗的方式,以大多数程序猿(媛)所需要了解的知识去介绍类型系统,但是又不丧失严谨性就是这篇文章写的意义。
基础版本
编译时就知道变量类型的是静态类型;运行时才知道一个变量类型的叫做动态类型。比如:
编译器在将 int age = 18;
这段代码编译的时候就会把 age 的类型确定,换言之,你不能对他进行除以 0 的操作等等,因为类型本身就定义了可操作的集合;但是像 C++ 里常见的 auto ite = vec.iterator();
这种也属于静态类型,这种叫做类型推导,通过已知的类型在编译时期推导出不知道的变量的类型。在静态类型语言中对一个变量做该变量类型所不允许的操作会报出语法错误。
但是像 var name = student.getName();
这行 JavaScript 代码就是动态类型的,因为这行代码只有在被执行的时候才知道 name 是字符串类型的,甚至是 null 或 undefined 类型。你也没办法进行类型推导,因为 student.getName 函数签名根本不包含返回值类型信息。后面会介绍通过一些其他手段来给函数签名加上类型。在动态类型中对一个变量做该变量类型所不允许的操作会报出运行时错误。
不允许隐式转换的是强类型,允许隐式转换的是弱类型。比如:
在 Python 中进行 '666' / 2
你会得到一个类型错误,这是因为强类型语言中是不允许隐式转换的,而在 JavaScript 中进行 '666' / 2
你会得到整数 333,这是因为在执行运算的时候字符串 '666' 先被转换成整数 666,然后再进行除法运算。
高级版本
需要先介绍一些基本概念:
Program Errors(程序错误)
Forbidden Behaviors(禁止行为)
程序在设计的时候会定义一组 forbidden behaviors,包括了所有的 untrapped errors,可能包括 trapped errors。
Well behaved、ill behaved
他们之间的关系可以用下图来表达:
从图中可以看出,绿色的 program 表示所有程序(所有程序,你能想到和不能想到的),error 表示出错的程序,error 不仅仅包括 trapped error 和 untrapped error。
根据图我们可以严格的定义动态类型,静态类型;强类型,弱类型
举个栗子:
在 Python 中执行 test = '666' / 3
你会在运行时得到一个 TypeError 错误,相当于运行时排除了 untrapped error,因此 Python 是动态类型,强类型语言。
在 JavaScript 中执行 var test = '666' / 3'
你会发现 test 的值变成了 222,因为这里发生了隐式转换,因此 JavaScript 是动态类型,弱类型的。更为夸张的是 [] == ![]
这样的代码在 JavaScript 中返回的是 true,这里是具体的 原因。
在 Java 中执行 int[] arr = new int[10]; arr[0] = '666' / 3;
你会在编译时期得到一个语法错误,这说明 Java 是静态类型的,执行 int[] arr = new int[10]; arr[11] = 3;
你会在运行时得到数组越界的错误(trapped error),这说明 Java 通过自身的类型系统排除了 untrapped error,因此 Java 是强类型的。
而 C 与 Java 类似,也是静态类型的,但是对于 int test[] = { 1, 2, 3 }; test[4] = 5;
这样的代码 C 语言是没办法发现你的问题的,因此这是 untrapped error,因此我们说 C 是弱类型的。
下图是常见的语言类型的划分:
另外,由于强类型语言一般需要在运行时运行一套类型检查系统,因此强类型语言的速度一般比弱类型要慢,动态类型也比静态类型慢,因此在上述所说的四种语言中执行的速度应该是 C > Java > JavaScript > Python。但是强类型,静态类型的语言写起来往往是最安全的。
静态类型由于在编译期会进行优化,所以一般来说性能是比较高的。而动态语言在进行类型操作的时候(比如字符串拼接,整数运算)还需要解释器去猜测其类型,因此性能很低;但是现代的解释器一般会有一些优化措施来提升速度,拿 JavaScript 的 V8 解释器举个栗子:
V8 的优化过程(粗略版本)
我们知道,像 Java / C++ 这样的静态类型语言对于对象一般都会有个类模板(一般调用函数的时候都是去类模板找的)。而像 V8 这种则是会在运行时创建类模板,从而在访问属性或调用方法的时候仅需要计算该属性在类模板中的偏移就可以了;传统的 JavaScript 对象一般是通过 Hash 或 Trie 树实现的,但是查找的效率很低。拿一段代码举例:
function Point(x, y) {
this.x = x;
this.y = y;
}
var p1 = new Point(1, 2);
在使用 new 调用 Point 函数的时候会先生成一个 class0 类模板(运行时生成),执行 this.x = x
的时候会生成 class1 类模板,执行 this.y = y
的时候会生成 class2 类模板。具体的转换过程如下图:
为一个对象确定一个类模板可以极大的提升属性的访问速度,类模板的确定就是通过走图里的路径(转换路径)。每当你增加或删除对象的属性的时候都会导致对象的类模板发生改变,甚至你增加的顺序不同也会生成不同的类模板!
V8 如果发现一个方法被调用(传入相同类型的参数)多次时,会使用 JIT 将函数编译成二进制代码,从而提升速度。
结合 V8 总结的优化方案:
弱类型语言由于在运行时缺乏类型系统,因此很容易出现类型操作上的 untrapped error;C 语言中我们前面介绍了数组访问越界的情况,这里我们以弱类型语言 JavaScript 为例:
===
像 JavaScript 这种动态类型的语言静态化后对运行时的安全性,效率肯定会有很大的提升的,目前有 TypeScript 这种预编译的方案;还有就是像 flow 这样的通过注释来标识类型的方案。