BOM(byte order mask)。在utf-8中的专有名词,作用是标识文本的字节读取顺序,其实就是上文5.1里的big endian与little endian。
BOM的遗留问题:其实在文本头添加BOM可以说是windows发明出来的概念,但这引来了兼容性问题:因为utf-8编码在linux中是默认不带有BOM的,而在windows是默认带有BOM的。这使得文本在linux与windows之间拷贝后,无法读取。 也正因为如此,额外引申出"utf-8 without BOM"这个编码,显示指定文本编码不带有BOM