当数据包含非ascii字符时,表示XML数据的正确方式是什么?下面是两个选项,它们是正确有效的。
选项1:<?xml version="1.0" encoding="UTF-8"?>
<name>Doña</name>
选项2:<?xml version="1.0" encoding="UTF-8"?>
<name>Doña</name>
F1是UTF-8十六进制中的统一字符编码。
发布于 2012-10-23 23:59:50
基本上,它们都是等价的,并且都是正确的。您甚至可以选择decimal Unicode codepoint,即ñ
。
这在很大程度上取决于您的工具需要什么。如果您的工具链中有一个步骤,需要使用纯ASCII,请使用选项2。如果人们在编辑器中查看您的XML,或者文件大小有问题,请使用选项1。如今,大多数XML布道者在大多数情况下倾向于使用选项1。
请注意,XML工具可以自由地在这些表示之间进行转换。这意味着,您永远不应该相信您的XML会以这样或那样的方式出现。在处理XML输入时,必须同时支持这两个选项。
https://stackoverflow.com/questions/13033193
复制相似问题