首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >什么是XML中的无效字符

什么是XML中的无效字符
EN

Stack Overflow用户
提问于 2009-04-08 13:55:41
回答 12查看 723.4K关注 0票数 267

我正在使用一些包含如下字符串的XML:

代码语言:javascript
复制
<node>This is a string</node>

我传递给节点的一些字符串将包含诸如&#$等字符:

代码语言:javascript
复制
<node>This is a string & so is this</node>

由于&,这是无效的。

我不能将这些字符串包装在CDATA中,因为它们需要原样。我尝试查找不在CDATA中就不能放入XML节点中的字符列表。

有没有人能给我指个方向,或者给我提供一个非法字符的列表?

EN

回答 12

Stack Overflow用户

回答已采纳

发布于 2009-04-08 13:59:49

唯一非法的字符是&<> (以及属性中的"',这取决于用于分隔属性值的字符:attr="must use &quot; here, ' is allowed"attr='must use &apos; here, " is allowed')。

它们是使用XML entities进行转义的,在本例中,您需要将&amp;用于&

不过,实际上,您应该使用一个工具或库来为您编写XML,并为您抽象出这类东西,这样您就不必担心它了。

票数 165
EN

Stack Overflow用户

发布于 2011-02-25 04:34:52

有效字符的列表在XML specification

代码语言:javascript
复制
Char       ::=      #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]  /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */
票数 176
EN

Stack Overflow用户

发布于 2013-01-15 01:31:18

这是一段C#代码,用于从字符串中删除XML无效字符并返回新的有效字符串。

代码语言:javascript
复制
public static string CleanInvalidXmlChars(string text) 
{ 
    // From xml spec valid chars: 
    // #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]     
    // any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. 
    string re = @"[^\x09\x0A\x0D\x20-\uD7FF\uE000-\uFFFD\u10000-\u10FFFF]"; 
    return Regex.Replace(text, re, ""); 
}
票数 62
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/730133

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档