编译: Python开发者 - 精算狗,英文:9tabs
http://blog.jobbole.com/113631/
自从我看了 Gary Bernhardt 备受推崇的一个视频Wat,就惊异于特定编程语言的怪异行为。相较于其他编程语言来说,某些编程语言的行为更出乎意料。例如,有一整本书是针对 Java 的边缘案例和古怪情况。同样,差不多只要 200 美元你就可以阅读C++ 规范说明了。
下面是我最喜欢的、惊奇的、滑稽的并仍然有效的咒语集合。一般来讲,利用这些古怪的行为被视为坏事,因为代码不应该出乎意料。值得庆幸的是,如果你尝试以下大多数蠢事,有很多代码校检工具(linters)已经准备好嘲笑你了。说了这么多,知识就是力量,那就开始吧。
Python 2 中对 True 邪恶的重赋值
>>>True=False
False
谢天谢地,这在 Python 3 中会导致SyntaxError,因为 True、False 和 None 现在是保留字。它仍远没有 C++ 的那个恶作剧那么邪恶,把#define true false悄悄写进同事的开发机器的标准头文件中。
Java 和 Python 中的诡异行为实例
对 Java 新手程序员来说,==的语义往往使人困惑。甚至在微不足道的情境下,这个操作符的前后矛盾也会使情况变得复杂,即使性能效益是值得的。
Integera=100;
Integerb=100;
System.out.print(a==b);// prints true
Integerc=200;
Integerd=200;
System.out.print(c==d);// prints false
JVM 会对区间 [-128, 127] 内的值使用相同的引用。更奇怪的是,Python 中也有同样的行为。
True
False
目前为止,还没有特别出乎意料的。
True
False
似乎 python 解释器使用相同例子的下限是……-5。区间 [-5, 256] 内的整数有同样的 ID。不知怎地,这变得更奇怪了。
False
>>>x,y=[-10,-10]
True
似乎使用解构赋值改变了这里的规则。我不确定为什么是这样。事实上,我在 Stack Overflow 上提了一个问题来试着理解它。我的猜测是,一个列表中的重复值指向同一个对象,用以节省内存。
C 中颠倒的下标符号
颠倒的下标符号,会使所有开发者都头疼。
intx[1]={0xdeadbeef};
printf("%xn",[x]);// prints deadbeef
这行得通的原因是,array[index]确实只是*(array + index)的语法糖。由于加法的交换性,我们可以交换数组和索引,并得到同样的结果。
C 中的“倒数”操作符
–>操作符第一次被看到时,似乎是句法错误。在你意识到它可编译时,它看起来像未被记载的语言特性。幸运的是,两者都不是。
for(x=3;x-->;){
printf("%d ",x);// prints 2 1 0
}
–>“操作符”实际上是两个操作符,在这个背景下解析为(x–) > 0。众所周知,大量使用会导致困惑,这完全是邪恶的。
C 中的sizeof操作符
sizeof操作符是一个编译时操作符,这给予了它有趣的属性。
intx=;
sizeof(x+=1);
if(x==){
printf("wtf?");// this will be printed
}
由于sizeof操作符的例子是对编译时进行评估的,(x += 1)不会运行。另一件趣事是,研究表明printf(“wtf?”)是最普遍的没有被 push 的代码。
Lua、Smalltalk、MATLAB 及其他语言,索引由 1 开始
/r/programminghumor 一直在用“indexing starts at 1”表情包取乐。令人震惊的是,有大量编程语言使用从 1 开始的数组索引。可以在这里找到更全面的清单。
Ruby 中的 0 被判为 true
… and only Ruby. *
在 Ruby 中是这样。*
ifthenprint'thanks, ruby'end# prints thanks, ruby
* edit: It was pointed out on reddit that this is true for Lua, Lisp, and Erlang as well.
* 修订:Reddit 上有人指出,这在 Lua、Lisp 和 Erlang 中也成立。
Trigraph, Digraphs, and Tokens in C
C 中的 Trigraph、Digraph 和 Token
由于历史原因,C 语言中的非字母符号有替代品。
if(trueandtrue){// same as if (true && true)
printf("thanks, c");
}
有些外国设备,例如 IBM 3270,在 C/C++ 中不提供某些常用符号,所以提供了 digraph、trigraph 和 token 来避免排斥特定字符集。
看完本文有收获?请转发分享给更多人
关注「Python开发者」,提升Python技能
领取专属 10元无门槛券
私享最新 技术干货