blocks|key|3375211|text|It+可能不是完美的(强调，因为人们错过了这份免责声明)，但我在这种情况下所做的事情如下所示。您可以调整以与流一起使用。|type|unstyled|depth|inlineStyleRanges|offset|length|style|BOLD|entityRanges|data|3375212|///+<summary>
///+Removes+control+characters+and+other+non-UTF-8+characters
///+</summary>
///+<param+name="inString">The+string+to+process</param>
///+<returns>A+string+with+no+control+characters+or+entities+above+0x00FD</returns>
public+static+string+RemoveTroublesomeCharacters(string+inString)
{
++++if+(inString+==+null)+return+null;

++++StringBuilder+newString+=+new+StringBuilder();
++++char+ch;

++++for+(int+i+=+0;+i+<+inString.Length;+i%2B%2B)
++++{

++++++++ch+=+inString[i];
++++++++//+remove+any+characters+outside+the+valid+UTF-8+range+as+well+as+all+control+characters
++++++++//+except+tabs+and+new+lines
++++++++//if+((ch+<+0x00FD+&&+ch+>+0x001F)+%7C%7C+ch+==+'\t'+%7C%7C+ch+==+'\n'+%7C%7C+ch+==+'\r')
++++++++//if+using+.NET+version+prior+to+4,+use+above+logic
++++++++if+(XmlConvert.IsXmlChar(ch))+//this+method+is+new+in+.NET+4
++++++++{
++++++++++++newString.Append(ch);
++++++++}
++++}
++++return+newString.ToString();

}|code-block|syntax|javascript|3375213|entityMap^0|3|7|0|0^^$0|@$1|2|3|4|5|6|7|M|8|@$9|N|A|O|B|C]]|D|@]|E|$]]|$1|F|3|G|5|H|7|P|8|@]|D|@]|E|$I|J]]|$1|K|3|-4|5|6|7|Q|8|@]|D|@]|E|$]]]|L|$]]

It may not be perfect (emphasis added since people missing this disclaimer), but what I've done in that case is below. You can adjust to use with a stream.

<pre><code>/// &lt;summary&gt;
/// Removes control characters and other non-UTF-8 characters
/// &lt;/summary&gt;
/// &lt;param name="inString"&gt;The string to process&lt;/param&gt;
/// &lt;returns&gt;A string with no control characters or entities above 0x00FD&lt;/returns&gt;
public static string RemoveTroublesomeCharacters(string inString)
{
 if (inString == null) return null;

 StringBuilder newString = new StringBuilder();
 char ch;

 for (int i = 0; i &lt; inString.Length; i++)
 {

 ch = inString[i];
 // remove any characters outside the valid UTF-8 range as well as all control characters
 // except tabs and new lines
 //if ((ch &lt; 0x00FD &amp;&amp; ch &gt; 0x001F) || ch == '\t' || ch == '\n' || ch == '\r')
 //if using .NET version prior to 4, use above logic
 if (XmlConvert.IsXmlChar(ch)) //this method is new in .NET 4
 {
 newString.Append(ch);
 }
 }
 return newString.ToString();

}
</code></pre>

blocks|key|3375354|text|我喜欢尤金的白名单概念。我需要做与原始海报类似的事情，但我需要支持所有Unicode字符，而不仅仅是0x00FD。XML规范是：|type|unstyled|depth|inlineStyleRanges|entityRanges|data|3375355|字符=+#x9+%7C+#xA+%7C+#xD+%7C+#x20-#xD7FF+%7C+#xE000-#xFFFD+%7C+#x10000-#x10FFFF|3375356|在.NET中，Unicode字符的内部表示只有16位，所以我们不能显式地‘允许’0x10000-0x10FFFF。XML规范明确禁止出现以0xD800开头的代理代码点。但是，如果我们在白名单中允许这些代理代码点，那么只要从.NET字符串中的utf-16字符的代理对生成正确的utf-8编码，utf-8编码就可能最终生成有效的XML。我还没有探索过这一点，所以我选择了更安全的方法，不允许在我的白名单中使用代理。|3375357|虽然尤金的解决方案中的注释具有误导性，但问题是我们排除的字符在XML中是无效的……它们是完全有效的Unicode代码点。我们不会删除‘`non+utf-8字符’。我们正在删除格式良好的XML文档中可能不会出现的utf-8字符。|3375358|public+static+string+XmlCharacterWhitelist(+string+in_string+)+{
++++if(+in_string+==+null+)+return+null;

++++StringBuilder+sbOutput+=+new+StringBuilder();
++++char+ch;

++++for(+int+i+=+0;+i+<+in_string.Length;+i%2B%2B+)+{
++++++++ch+=+in_string[i];
++++++++if(+(+ch+>=+0x0020+&&+ch+<=+0xD7FF+)+%7C%7C+
++++++++++++(+ch+>=+0xE000+&&+ch+<=+0xFFFD+)+%7C%7C
++++++++++++ch+==+0x0009+%7C%7C
++++++++++++ch+==+0x000A+%7C%7C+
++++++++++++ch+==+0x000D+)+{
++++++++++++sbOutput.Append(+ch+);
++++++++}
++++}
++++return+sbOutput.ToString();
}|code-block|syntax|javascript|3375359|entityMap^0|0|0|0|0|0^^$0|@$1|2|3|4|5|6|7|O|8|@]|9|@]|A|$]]|$1|B|3|C|5|6|7|P|8|@]|9|@]|A|$]]|$1|D|3|E|5|6|7|Q|8|@]|9|@]|A|$]]|$1|F|3|G|5|6|7|R|8|@]|9|@]|A|$]]|$1|H|3|I|5|J|7|S|8|@]|9|@]|A|$K|L]]|$1|M|3|-4|5|6|7|T|8|@]|9|@]|A|$]]]|N|$]]

I like Eugene's whitelist concept. I needed to do a similar thing as the original poster, but I needed to support all Unicode characters, not just up to 0x00FD. The XML spec is:

Char = #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]

In .NET, the internal representation of Unicode characters is only 16 bits, so we can't `allow' 0x10000-0x10FFFF explicitly. The XML spec explicitly disallows the surrogate code points starting at 0xD800 from appearing. However it is possible that if we allowed these surrogate code points in our whitelist, utf-8 encoding our string might produce valid XML in the end as long as proper utf-8 encoding was produced from the surrogate pairs of utf-16 characters in the .NET string. I haven't explored this though, so I went with the safer bet and didn't allow the surrogates in my whitelist.

The comments in Eugene's solution are misleading though, the problem is that the characters we are excluding are not valid in XML ... they are perfectly valid Unicode code points. We are not removing `non-utf-8 characters'. We are removing utf-8 characters that may not appear in well-formed XML documents.

<pre><code>public static string XmlCharacterWhitelist( string in_string ) {
 if( in_string == null ) return null;

 StringBuilder sbOutput = new StringBuilder();
 char ch;

 for( int i = 0; i &lt; in_string.Length; i++ ) {
 ch = in_string[i];
 if( ( ch &gt;= 0x0020 &amp;&amp; ch &lt;= 0xD7FF ) || 
 ( ch &gt;= 0xE000 &amp;&amp; ch &lt;= 0xFFFD ) ||
 ch == 0x0009 ||
 ch == 0x000A || 
 ch == 0x000D ) {
 sbOutput.Append( ch );
 }
 }
 return sbOutput.ToString();
}
</code></pre>

blocks|key|366743|text|private+static+String+removeNonUtf8CompliantCharacters(+final+String+inString+)+{
++++if+(null+==+inString+)+return+null;
++++byte[]+byteArr+=+inString.getBytes();
++++for+(+int+i=0;+i+<+byteArr.length;+i%2B%2B+)+{
++++++++byte+ch=+byteArr[i];+
++++++++//+remove+any+characters+outside+the+valid+UTF-8+range+as+well+as+all+control+characters
++++++++//+except+tabs+and+new+lines
++++++++if+(+!(+(ch+>+31+&&+ch+<+253+)+%7C%7C+ch+==+'\t'+%7C%7C+ch+==+'\n'+%7C%7C+ch+==+'\r')+)+{
++++++++++++byteArr[i]='+';
++++++++}
++++}
++++return+new+String(+byteArr+);
}|type|code-block|depth|inlineStyleRanges|entityRanges|data|syntax|javascript|366744|unstyled|entityMap^0|0^^$0|@$1|2|3|4|5|6|7|G|8|@]|9|@]|A|$B|C]]|$1|D|3|-4|5|E|7|H|8|@]|9|@]|A|$]]]|F|$]]

<pre><code>private static String removeNonUtf8CompliantCharacters( final String inString ) {
 if (null == inString ) return null;
 byte[] byteArr = inString.getBytes();
 for ( int i=0; i &lt; byteArr.length; i++ ) {
 byte ch= byteArr[i]; 
 // remove any characters outside the valid UTF-8 range as well as all control characters
 // except tabs and new lines
 if ( !( (ch &gt; 31 &amp;&amp; ch &lt; 253 ) || ch == '\t' || ch == '\n' || ch == '\r') ) {
 byteArr[i]=' ';
 }
 }
 return new String( byteArr );
}
</code></pre>

blocks|key|3375385|text|在PHP上试试吧！|type|unstyled|depth|inlineStyleRanges|entityRanges|data|3375386|$goodUTF8+=+iconv("utf-8",+"utf-8//IGNORE",+$badUTF8);|code-block|syntax|javascript|3375387|entityMap^0|0|0^^$0|@$1|2|3|4|5|6|7|I|8|@]|9|@]|A|$]]|$1|B|3|C|5|D|7|J|8|@]|9|@]|A|$E|F]]|$1|G|3|-4|5|6|7|K|8|@]|9|@]|A|$]]]|H|$]]

Try this for PHP!

<pre><code>$goodUTF8 = iconv("utf-8", "utf-8//IGNORE", $badUTF8);
</code></pre>

blocks|key|3375413|text|上面的解决方案似乎是为了在转换为XML之前删除无效字符。|type|unstyled|depth|inlineStyleRanges|entityRanges|data|3375414|使用此代码可以从XML字符串中删除无效的XML字符。例如：&x1A；|3375415|++++public+static+string+CleanInvalidXmlChars(+string+Xml,+string+XMLVersion+)
++++{
++++++++string+pattern+=+String.Empty;
++++++++switch(+XMLVersion+)
++++++++{
++++++++++++case+"1.0":
++++++++++++++++pattern+=+@"&#x((10?%7C[2-F])FFF[EF]%7CFDD[0-9A-F]%7C7F%7C8[0-46-9A-F]9[0-9A-F]);";
++++++++++++++++break;
++++++++++++case+"1.1":
++++++++++++++++pattern+=+@"&#x((10?%7C[2-F])FFF[EF]%7CFDD[0-9A-F]%7C[19][0-9A-F]%7C7F%7C8[0-46-9A-F]%7C0?[1-8BCEF]);";
++++++++++++++++break;
++++++++++++default:
++++++++++++++++throw+new+Exception(+"Error:+Invalid+XML+Version!"+);
++++++++}

++++++++Regex+regex+=+new+Regex(+pattern,+RegexOptions.IgnoreCase+);
++++++++if(+regex.IsMatch(+Xml+)+)
++++++++++++Xml+=+regex.Replace(+Xml,+String.Empty+);
++++++++return+Xml;
++++}|code-block|syntax|javascript|3375416|http://balajiramesh.wordpress.com/2008/05/30/strip-illegal-xml-characters-based-on-w3c-standard/|offset|length|3375417|entityMap|0|LINK|mutability|MUTABLE|url^0|0|0|0|0|2O|0|0^^$0|@$1|2|3|4|5|6|7|T|8|@]|9|@]|A|$]]|$1|B|3|C|5|6|7|U|8|@]|9|@]|A|$]]|$1|D|3|E|5|F|7|V|8|@]|9|@]|A|$G|H]]|$1|I|3|J|5|6|7|W|8|@]|9|@$K|X|L|Y|1|Z]]|A|$]]|$1|M|3|-4|5|6|7|10|8|@]|9|@]|A|$]]]|N|$O|$5|P|Q|R|A|$S|J]]]]

The above solutions seem to be for removing invalid characters prior to converting to XML.

Use this code to remove invalid XML characters from an XML string. eg. &x1A;

<pre><code> public static string CleanInvalidXmlChars( string Xml, string XMLVersion )
 {
 string pattern = String.Empty;
 switch( XMLVersion )
 {
 case "1.0":
 pattern = @"&amp;#x((10?|[2-F])FFF[EF]|FDD[0-9A-F]|7F|8[0-46-9A-F]9[0-9A-F]);";
 break;
 case "1.1":
 pattern = @"&amp;#x((10?|[2-F])FFF[EF]|FDD[0-9A-F]|[19][0-9A-F]|7F|8[0-46-9A-F]|0?[1-8BCEF]);";
 break;
 default:
 throw new Exception( "Error: Invalid XML Version!" );
 }

 Regex regex = new Regex( pattern, RegexOptions.IgnoreCase );
 if( regex.IsMatch( Xml ) )
 Xml = regex.Replace( Xml, String.Empty );
 return Xml;
 }
</code></pre>

<a href="http://balajiramesh.wordpress.com/2008/05/30/strip-illegal-xml-characters-based-on-w3c-standard/" rel="nofollow">http://balajiramesh.wordpress.com/2008/05/30/strip-illegal-xml-characters-based-on-w3c-standard/</a>

blocks|key|370185|text|您可以使用以下内容传递非UTF字符：|type|unstyled|depth|inlineStyleRanges|entityRanges|data|370186|string+sFinalString++=+"";
string+hex+=+"";
foreach+(char+ch+in+UTFCHAR)
{
++++int+tmp+=+ch;
+++if+((ch+<+0x00FD+&&+ch+>+0x001F)+%7C%7C+ch+==+'\t'+%7C%7C+ch+==+'\n'+%7C%7C+ch+==+'\r')
++++{
++++sFinalString++%2B=+ch;
++++}
++++else
++++{++
++++++sFinalString++%2B=+"&#"+%2B+tmp%2B";";
++++}
}|code-block|syntax|javascript|370187|entityMap^0|0|0^^$0|@$1|2|3|4|5|6|7|I|8|@]|9|@]|A|$]]|$1|B|3|C|5|D|7|J|8|@]|9|@]|A|$E|F]]|$1|G|3|-4|5|6|7|K|8|@]|9|@]|A|$]]]|H|$]]

You can pass non-UTF characters with the following:

<pre><code>string sFinalString = "";
string hex = "";
foreach (char ch in UTFCHAR)
{
 int tmp = ch;
 if ((ch &lt; 0x00FD &amp;&amp; ch &gt; 0x001F) || ch == '\t' || ch == '\n' || ch == '\r')
 {
 sFinalString += ch;
 }
 else
 { 
 sFinalString += "&amp;#" + tmp+";";
 }
}
</code></pre>

blocks|key|365371|text|要实现dnewcombe's答案的现代化，您可以采用稍微简单一点的方法|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|365372|public+static+string+RemoveInvalidXmlChars(string+input)
{
++++var+isValid+=+new+Predicate<char>(value+=>
++++++++(value+>=+0x0020+&&+value+<=+0xD7FF)+%7C%7C
++++++++(value+>=+0xE000+&&+value+<=+0xFFFD)+%7C%7C
++++++++value+==+0x0009+%7C%7C
++++++++value+==+0x000A+%7C%7C
++++++++value+==+0x000D);

++++return+new+string(Array.FindAll(input.ToCharArray(),+isValid));
}|code-block|syntax|javascript|365373|或者，使用Linq|365374|public+static+string+RemoveInvalidXmlChars(string+input)
{
++++return+new+string(input.Where(value+=>
++++++++(value+>=+0x0020+&&+value+<=+0xD7FF)+%7C%7C
++++++++(value+>=+0xE000+&&+value+<=+0xFFFD)+%7C%7C
++++++++value+==+0x0009+%7C%7C
++++++++value+==+0x000A+%7C%7C
++++++++value+==+0x000D).ToArray());
}|365375|我很想知道这些方法的性能如何比较，以及它们都与使用Buffer.BlockCopy的黑名单方法进行比较。|style|CODE|365376|entityMap|0|LINK|mutability|MUTABLE|url|https://stackoverflow.com/a/641632/659190^0|3|B|0|0|0|0|0|P|G|0^^$0|@$1|2|3|4|5|6|7|Y|8|@]|9|@$A|Z|B|10|1|11]]|C|$]]|$1|D|3|E|5|F|7|12|8|@]|9|@]|C|$G|H]]|$1|I|3|J|5|6|7|13|8|@]|9|@]|C|$]]|$1|K|3|L|5|F|7|14|8|@]|9|@]|C|$G|H]]|$1|M|3|N|5|6|7|15|8|@$A|16|B|17|O|P]]|9|@]|C|$]]|$1|Q|3|-4|5|6|7|18|8|@]|9|@]|C|$]]]|R|$S|$5|T|U|V|C|$W|X]]]]

Modernising <a href="https://stackoverflow.com/a/641632/659190">dnewcombe's</a> answer, you could take a slightly simpler approach

<pre><code>public static string RemoveInvalidXmlChars(string input)
{
 var isValid = new Predicate&lt;char&gt;(value =&gt;
 (value &gt;= 0x0020 &amp;&amp; value &lt;= 0xD7FF) ||
 (value &gt;= 0xE000 &amp;&amp; value &lt;= 0xFFFD) ||
 value == 0x0009 ||
 value == 0x000A ||
 value == 0x000D);

 return new string(Array.FindAll(input.ToCharArray(), isValid));
}
</code></pre>

or, with Linq

<pre><code>public static string RemoveInvalidXmlChars(string input)
{
 return new string(input.Where(value =&gt;
 (value &gt;= 0x0020 &amp;&amp; value &lt;= 0xD7FF) ||
 (value &gt;= 0xE000 &amp;&amp; value &lt;= 0xFFFD) ||
 value == 0x0009 ||
 value == 0x000A ||
 value == 0x000D).ToArray());
}
</code></pre>

I'd be interested to know how the performance of these methods compares and how they all compare to a black list approach using <code>Buffer.BlockCopy</code>.

blocks|key|370255|text|作为删除无效XML字符的方法，我建议您使用XmlConvert.IsXmlChar方法。它是从Silverlight+Framework4开始添加的，现在也出现在.NET中。下面是一个小示例：|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|370256|void+Main()+{
++++string+content+=+"\v\f\0";
++++Console.WriteLine(IsValidXmlString(content));+//+False

++++content+=+RemoveInvalidXmlChars(content);
++++Console.WriteLine(IsValidXmlString(content));+//+True
}

static+string+RemoveInvalidXmlChars(string+text)+{
++++char[]+validXmlChars+=+text.Where(ch+=>+XmlConvert.IsXmlChar(ch)).ToArray();
++++return+new+string(validXmlChars);
}

static+bool+IsValidXmlString(string+text)+{
++++try+{
++++++++XmlConvert.VerifyXmlChars(text);
++++++++return+true;
++++}+catch+{
++++++++return+false;
++++}
}|code-block|syntax|javascript|370257|entityMap|0|LINK|mutability|MUTABLE|url|http://msdn.microsoft.com/en-us/library/system.xml.xmlconvert.isxmlchar%2528v=vs.100%2529.aspx^0|L|K|0|0|0^^$0|@$1|2|3|4|5|6|7|Q|8|@]|9|@$A|R|B|S|1|T]]|C|$]]|$1|D|3|E|5|F|7|U|8|@]|9|@]|C|$G|H]]|$1|I|3|-4|5|6|7|V|8|@]|9|@]|C|$]]]|J|$K|$5|L|M|N|C|$O|P]]]]

As the way to remove invalid XML characters I suggest you to use <a href="http://msdn.microsoft.com/en-us/library/system.xml.xmlconvert.isxmlchar%28v=vs.100%29.aspx" rel="noreferrer">XmlConvert.IsXmlChar</a> method. It was added since .NET Framework 4 and is presented in Silverlight too. Here is the small sample:

<pre><code>void Main() {
 string content = "\v\f\0";
 Console.WriteLine(IsValidXmlString(content)); // False

 content = RemoveInvalidXmlChars(content);
 Console.WriteLine(IsValidXmlString(content)); // True
}

static string RemoveInvalidXmlChars(string text) {
 char[] validXmlChars = text.Where(ch =&gt; XmlConvert.IsXmlChar(ch)).ToArray();
 return new string(validXmlChars);
}

static bool IsValidXmlString(string text) {
 try {
 XmlConvert.VerifyXmlChars(text);
 return true;
 } catch {
 return false;
 }
}
</code></pre>

blocks|key|366849|text|基于正则表达式的方法|type|unstyled|depth|inlineStyleRanges|entityRanges|data|366850|public+static+string+StripInvalidXmlCharacters(string+str)
{
++++var+invalidXmlCharactersRegex+=+new+Regex("[%5E\u0009\u000a\u000d\u0020-\ud7ff\ue000-\ufffd]%7C([\ud800-\udbff](?![\udc00-\udfff]))%7C((?<![\ud800-\udbff])[\udc00-\udfff])");
++++return+invalidXmlCharactersRegex.Replace(str,+"");|code-block|syntax|javascript|366851|}|366852|有关详细信息，请参阅我的blogpost|offset|length|366853|entityMap|0|LINK|mutability|MUTABLE|url|http://mnaoumov.wordpress.com/2014/06/15/escaping-invalid-xml-unicode-characters/^0|0|0|0|C|8|0|0^^$0|@$1|2|3|4|5|6|7|U|8|@]|9|@]|A|$]]|$1|B|3|C|5|D|7|V|8|@]|9|@]|A|$E|F]]|$1|G|3|H|5|6|7|W|8|@]|9|@]|A|$]]|$1|I|3|J|5|6|7|X|8|@]|9|@$K|Y|L|Z|1|10]]|A|$]]|$1|M|3|-4|5|6|7|11|8|@]|9|@]|A|$]]]|N|$O|$5|P|Q|R|A|$S|T]]]]

Regex based approach

<pre><code>public static string StripInvalidXmlCharacters(string str)
{
 var invalidXmlCharactersRegex = new Regex("[^\u0009\u000a\u000d\u0020-\ud7ff\ue000-\ufffd]|([\ud800-\udbff](?![\udc00-\udfff]))|((?&lt;![\ud800-\udbff])[\udc00-\udfff])");
 return invalidXmlCharactersRegex.Replace(str, "");
</code></pre>

}

See my <a href="http://mnaoumov.wordpress.com/2014/06/15/escaping-invalid-xml-unicode-characters/" rel="nofollow">blogpost</a> for more details

blocks|key|3375626|text|这是dnewcome在自定义StreamReader中的答案，它简单地包装了一个真正的流阅读器，并在读取字符时替换掉它们。|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|3375627|为了节省时间，我只实现了几个方法。我将它与XDocument.Load和一个文件流结合使用，并且只调用了Read(char[]+buffer，int+index，int+count)方法，所以它是这样工作的。您可能需要实现其他方法才能使其适用于您的应用程序。我使用这种方法是因为它似乎比其他答案更有效。我也只实现了其中一个构造函数，显然您可以实现所需的任何StreamReader构造函数，因为它只是一个传递。|3375628|我选择替换字符而不是删除它们，因为这大大简化了解决方案。通过这种方式，文本的长度保持不变，因此不需要跟踪单独的索引。|3375629|public+class+InvalidXmlCharacterReplacingStreamReader+:+TextReader
{
++++private+StreamReader+implementingStreamReader;
++++private+char+replacementCharacter;

++++public+InvalidXmlCharacterReplacingStreamReader(Stream+stream,+char+replacementCharacter)
++++{
++++++++implementingStreamReader+=+new+StreamReader(stream);
++++++++this.replacementCharacter+=+replacementCharacter;
++++}

++++public+override+void+Close()
++++{
++++++++implementingStreamReader.Close();
++++}

++++public+override+ObjRef+CreateObjRef(Type+requestedType)
++++{
++++++++return+implementingStreamReader.CreateObjRef(requestedType);
++++}

++++public+void+Dispose()
++++{
++++++++implementingStreamReader.Dispose();
++++}

++++public+override+bool+Equals(object+obj)
++++{
++++++++return+implementingStreamReader.Equals(obj);
++++}

++++public+override+int+GetHashCode()
++++{
++++++++return+implementingStreamReader.GetHashCode();
++++}

++++public+override+object+InitializeLifetimeService()
++++{
++++++++return+implementingStreamReader.InitializeLifetimeService();
++++}

++++public+override+int+Peek()
++++{
++++++++int+ch+=+implementingStreamReader.Peek();
++++++++if+(ch+!=+-1)
++++++++{
++++++++++++if+(
++++++++++++++++(ch+<+0x0020+%7C%7C+ch+>+0xD7FF)+&&
++++++++++++++++(ch+<+0xE000+%7C%7C+ch+>+0xFFFD)+&&
++++++++++++++++ch+!=+0x0009+&&
++++++++++++++++ch+!=+0x000A+&&
++++++++++++++++ch+!=+0x000D
++++++++++++++++)
++++++++++++{
++++++++++++++++return+replacementCharacter;
++++++++++++}
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read()
++++{
++++++++int+ch+=+implementingStreamReader.Read();
++++++++if+(ch+!=+-1)
++++++++{
++++++++++++if+(
++++++++++++++++(ch+<+0x0020+%7C%7C+ch+>+0xD7FF)+&&
++++++++++++++++(ch+<+0xE000+%7C%7C+ch+>+0xFFFD)+&&
++++++++++++++++ch+!=+0x0009+&&
++++++++++++++++ch+!=+0x000A+&&
++++++++++++++++ch+!=+0x000D
++++++++++++++++)
++++++++++++{
++++++++++++++++return+replacementCharacter;
++++++++++++}
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read(char[]+buffer,+int+index,+int+count)
++++{
++++++++int+readCount+=+implementingStreamReader.Read(buffer,+index,+count);
++++++++for+(int+i+=+index;+i+<+readCount%2Bindex;+i%2B%2B)
++++++++{
++++++++++++char+ch+=+buffer[i];
++++++++++++if+(
++++++++++++++++(ch+<+0x0020+%7C%7C+ch+>+0xD7FF)+&&
++++++++++++++++(ch+<+0xE000+%7C%7C+ch+>+0xFFFD)+&&
++++++++++++++++ch+!=+0x0009+&&
++++++++++++++++ch+!=+0x000A+&&
++++++++++++++++ch+!=+0x000D
++++++++++++++++)
++++++++++++{
++++++++++++++++buffer[i]+=+replacementCharacter;
++++++++++++}
++++++++}
++++++++return+readCount;
++++}

++++public+override+Task<int>+ReadAsync(char[]+buffer,+int+index,+int+count)
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+int+ReadBlock(char[]+buffer,+int+index,+int+count)
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+Task<int>+ReadBlockAsync(char[]+buffer,+int+index,+int+count)
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+string+ReadLine()
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+Task<string>+ReadLineAsync()
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+string+ReadToEnd()
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+Task<string>+ReadToEndAsync()
++++{
++++++++throw+new+NotImplementedException();
++++}

++++public+override+string+ToString()
++++{
++++++++return+implementingStreamReader.ToString();
++++}
}|code-block|syntax|javascript|3375630|entityMap|0|LINK|mutability|MUTABLE|url|https://stackoverflow.com/a/641632/4313632^0|2|8|0|0|0|0|0^^$0|@$1|2|3|4|5|6|7|U|8|@]|9|@$A|V|B|W|1|X]]|C|$]]|$1|D|3|E|5|6|7|Y|8|@]|9|@]|C|$]]|$1|F|3|G|5|6|7|Z|8|@]|9|@]|C|$]]|$1|H|3|I|5|J|7|10|8|@]|9|@]|C|$K|L]]|$1|M|3|-4|5|6|7|11|8|@]|9|@]|C|$]]]|N|$O|$5|P|Q|R|C|$S|T]]]]

Here is <a href="https://stackoverflow.com/a/641632/4313632">dnewcome</a>'s answer in a custom StreamReader. It simply wraps a real stream reader and replaces the characters as they are read. 

I only implemented a few methods to save myself time. I used this in conjunction with XDocument.Load and a file stream and only the Read(char[] buffer, int index, int count) method was called, so it worked like this. You may need to implement additional methods to get this to work for your application. I used this approach because it seems more efficient than the other answers. I also only implemented one of the constructors, you could obviously implement any of the StreamReader constructors that you need, since it is just a pass through. 

I chose to replace the characters rather than removing them because it greatly simplifies the solution. In this way the length of the text stays the same, so there is no need to keep track of a separate index.

<pre><code>public class InvalidXmlCharacterReplacingStreamReader : TextReader
{
 private StreamReader implementingStreamReader;
 private char replacementCharacter;

 public InvalidXmlCharacterReplacingStreamReader(Stream stream, char replacementCharacter)
 {
 implementingStreamReader = new StreamReader(stream);
 this.replacementCharacter = replacementCharacter;
 }

 public override void Close()
 {
 implementingStreamReader.Close();
 }

 public override ObjRef CreateObjRef(Type requestedType)
 {
 return implementingStreamReader.CreateObjRef(requestedType);
 }

 public void Dispose()
 {
 implementingStreamReader.Dispose();
 }

 public override bool Equals(object obj)
 {
 return implementingStreamReader.Equals(obj);
 }

 public override int GetHashCode()
 {
 return implementingStreamReader.GetHashCode();
 }

 public override object InitializeLifetimeService()
 {
 return implementingStreamReader.InitializeLifetimeService();
 }

 public override int Peek()
 {
 int ch = implementingStreamReader.Peek();
 if (ch != -1)
 {
 if (
 (ch &lt; 0x0020 || ch &gt; 0xD7FF) &amp;&amp;
 (ch &lt; 0xE000 || ch &gt; 0xFFFD) &amp;&amp;
 ch != 0x0009 &amp;&amp;
 ch != 0x000A &amp;&amp;
 ch != 0x000D
 )
 {
 return replacementCharacter;
 }
 }
 return ch;
 }

 public override int Read()
 {
 int ch = implementingStreamReader.Read();
 if (ch != -1)
 {
 if (
 (ch &lt; 0x0020 || ch &gt; 0xD7FF) &amp;&amp;
 (ch &lt; 0xE000 || ch &gt; 0xFFFD) &amp;&amp;
 ch != 0x0009 &amp;&amp;
 ch != 0x000A &amp;&amp;
 ch != 0x000D
 )
 {
 return replacementCharacter;
 }
 }
 return ch;
 }

 public override int Read(char[] buffer, int index, int count)
 {
 int readCount = implementingStreamReader.Read(buffer, index, count);
 for (int i = index; i &lt; readCount+index; i++)
 {
 char ch = buffer[i];
 if (
 (ch &lt; 0x0020 || ch &gt; 0xD7FF) &amp;&amp;
 (ch &lt; 0xE000 || ch &gt; 0xFFFD) &amp;&amp;
 ch != 0x0009 &amp;&amp;
 ch != 0x000A &amp;&amp;
 ch != 0x000D
 )
 {
 buffer[i] = replacementCharacter;
 }
 }
 return readCount;
 }

 public override Task&lt;int&gt; ReadAsync(char[] buffer, int index, int count)
 {
 throw new NotImplementedException();
 }

 public override int ReadBlock(char[] buffer, int index, int count)
 {
 throw new NotImplementedException();
 }

 public override Task&lt;int&gt; ReadBlockAsync(char[] buffer, int index, int count)
 {
 throw new NotImplementedException();
 }

 public override string ReadLine()
 {
 throw new NotImplementedException();
 }

 public override Task&lt;string&gt; ReadLineAsync()
 {
 throw new NotImplementedException();
 }

 public override string ReadToEnd()
 {
 throw new NotImplementedException();
 }

 public override Task&lt;string&gt; ReadToEndAsync()
 {
 throw new NotImplementedException();
 }

 public override string ToString()
 {
 return implementingStreamReader.ToString();
 }
}
</code></pre>

blocks|key|3162853|text|this+answer解决方案的干式实现(使用不同的构造函数-请随意在应用程序中使用所需的构造函数)：|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|3162854|public+class+InvalidXmlCharacterReplacingStreamReader+:+StreamReader
{
++++private+readonly+char+_replacementCharacter;

++++public+InvalidXmlCharacterReplacingStreamReader(string+fileName,+char+replacementCharacter)+:+base(fileName)
++++{
++++++++this._replacementCharacter+=+replacementCharacter;
++++}

++++public+override+int+Peek()
++++{
++++++++int+ch+=+base.Peek();
++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++{
++++++++++++return+this._replacementCharacter;
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read()
++++{
++++++++int+ch+=+base.Read();
++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++{
++++++++++++return+this._replacementCharacter;
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read(char[]+buffer,+int+index,+int+count)
++++{
++++++++int+readCount+=+base.Read(buffer,+index,+count);
++++++++for+(int+i+=+index;+i+<+readCount+%2B+index;+i%2B%2B)
++++++++{
++++++++++++char+ch+=+buffer[i];
++++++++++++if+(IsInvalidChar(ch))
++++++++++++{
++++++++++++++++buffer[i]+=+this._replacementCharacter;
++++++++++++}
++++++++}
++++++++return+readCount;
++++}

++++private+static+bool+IsInvalidChar(int+ch)
++++{
++++++++return+(ch+<+0x0020+%7C%7C+ch+>+0xD7FF)+&&
+++++++++++++++(ch+<+0xE000+%7C%7C+ch+>+0xFFFD)+&&
++++++++++++++++ch+!=+0x0009+&&
++++++++++++++++ch+!=+0x000A+&&
++++++++++++++++ch+!=+0x000D;
++++}
}|code-block|syntax|javascript|3162855|entityMap|0|LINK|mutability|MUTABLE|url|https://stackoverflow.com/a/27239510/897326^0|0|B|0|0|0^^$0|@$1|2|3|4|5|6|7|Q|8|@]|9|@$A|R|B|S|1|T]]|C|$]]|$1|D|3|E|5|F|7|U|8|@]|9|@]|C|$G|H]]|$1|I|3|-4|5|6|7|V|8|@]|9|@]|C|$]]]|J|$K|$5|L|M|N|C|$O|P]]]]

DRY implementation of <a href="https://stackoverflow.com/a/27239510/897326">this answer</a>'s solution (using a different constructor - feel free to use the one you need in your application):

<pre><code>public class InvalidXmlCharacterReplacingStreamReader : StreamReader
{
 private readonly char _replacementCharacter;

 public InvalidXmlCharacterReplacingStreamReader(string fileName, char replacementCharacter) : base(fileName)
 {
 this._replacementCharacter = replacementCharacter;
 }

 public override int Peek()
 {
 int ch = base.Peek();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 return this._replacementCharacter;
 }
 return ch;
 }

 public override int Read()
 {
 int ch = base.Read();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 return this._replacementCharacter;
 }
 return ch;
 }

 public override int Read(char[] buffer, int index, int count)
 {
 int readCount = base.Read(buffer, index, count);
 for (int i = index; i &lt; readCount + index; i++)
 {
 char ch = buffer[i];
 if (IsInvalidChar(ch))
 {
 buffer[i] = this._replacementCharacter;
 }
 }
 return readCount;
 }

 private static bool IsInvalidChar(int ch)
 {
 return (ch &lt; 0x0020 || ch &gt; 0xD7FF) &amp;&amp;
 (ch &lt; 0xE000 || ch &gt; 0xFFFD) &amp;&amp;
 ch != 0x0009 &amp;&amp;
 ch != 0x000A &amp;&amp;
 ch != 0x000D;
 }
}
</code></pre>

blocks|key|365473|text|使用此函数删除无效的xml字符。|type|unstyled|depth|inlineStyleRanges|entityRanges|data|365474|public+static+string+CleanInvalidXmlChars(string+text)+++
{+++
+++++++string+re+=+@"[%5E\x09\x0A\x0D\x20-\xD7FF\xE000-\xFFFD\x10000-x10FFFF]";+++
+++++++return+Regex.Replace(text,+re,+"");+++
}+|code-block|syntax|javascript|365475|entityMap^0|0|0^^$0|@$1|2|3|4|5|6|7|I|8|@]|9|@]|A|$]]|$1|B|3|C|5|D|7|J|8|@]|9|@]|A|$E|F]]|$1|G|3|-4|5|6|7|K|8|@]|9|@]|A|$]]]|H|$]]

Use this function to remove invalid xml characters.

<pre><code>public static string CleanInvalidXmlChars(string text) 
{ 
 string re = @"[^\x09\x0A\x0D\x20-\xD7FF\xE000-\xFFFD\x10000-x10FFFF]"; 
 return Regex.Replace(text, re, ""); 
} 
</code></pre>

blocks|key|370313|text|Neolisk+above修改的答案或原始答案。|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|370314|Changes:+of+\0字符传递，删除完成，而不是替换。此外，还使用了XmlConvert.IsXmlChar(char)方法|370315|++++///+<summary>
++++///+Replaces+invalid+Xml+characters+from+input+file,+NOTE:+if+replacement+character+is+\0,+then+invalid+Xml+character+is+removed,+instead+of+1-for-1+replacement
++++///+</summary>
++++public+class+InvalidXmlCharacterReplacingStreamReader+:+StreamReader
++++{
++++++++private+readonly+char+_replacementCharacter;

++++++++public+InvalidXmlCharacterReplacingStreamReader(string+fileName,+char+replacementCharacter)
++++++++++++:+base(fileName)
++++++++{
++++++++++++_replacementCharacter+=+replacementCharacter;
++++++++}

++++++++public+override+int+Peek()
++++++++{
++++++++++++int+ch+=+base.Peek();
++++++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++++++{
++++++++++++++++if+('\0'+==+_replacementCharacter)
++++++++++++++++++++return+Peek();+//+peek+at+the+next+one

++++++++++++++++return+_replacementCharacter;
++++++++++++}
++++++++++++return+ch;
++++++++}

++++++++public+override+int+Read()
++++++++{
++++++++++++int+ch+=+base.Read();
++++++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++++++{
++++++++++++++++if+('\0'+==+_replacementCharacter)
++++++++++++++++++++return+Read();+//+read+next+one

++++++++++++++++return+_replacementCharacter;
++++++++++++}
++++++++++++return+ch;
++++++++}

++++++++public+override+int+Read(char[]+buffer,+int+index,+int+count)
++++++++{
++++++++++++int+readCount=+0,+ch;

++++++++++++for+(int+i+=+0;+i+<+count+&&+(ch+=+Read())+!=+-1;+i%2B%2B)
++++++++++++{
++++++++++++++++readCount%2B%2B;
++++++++++++++++buffer[index+%2B+i]+=+(char)ch;
++++++++++++}

++++++++++++return+readCount;
++++++++}


++++++++private+static+bool+IsInvalidChar(int+ch)
++++++++{
++++++++++++return+!XmlConvert.IsXmlChar((char)ch);
++++++++}
++++}|code-block|syntax|javascript|370316|entityMap|0|LINK|mutability|MUTABLE|url|https://stackoverflow.com/a/30351313/1295946^0|0|D|0|0|0|0^^$0|@$1|2|3|4|5|6|7|S|8|@]|9|@$A|T|B|U|1|V]]|C|$]]|$1|D|3|E|5|6|7|W|8|@]|9|@]|C|$]]|$1|F|3|G|5|H|7|X|8|@]|9|@]|C|$I|J]]|$1|K|3|-4|5|6|7|Y|8|@]|9|@]|C|$]]]|L|$M|$5|N|O|P|C|$Q|R]]]]

Modified answer or original answer by <a href="https://stackoverflow.com/a/30351313/1295946">Neolisk above</a>.
 Changes: of \0 character is passed, removal is done, rather than a replacement. also, made use of XmlConvert.IsXmlChar(char) method

<pre><code> /// &lt;summary&gt;
 /// Replaces invalid Xml characters from input file, NOTE: if replacement character is \0, then invalid Xml character is removed, instead of 1-for-1 replacement
 /// &lt;/summary&gt;
 public class InvalidXmlCharacterReplacingStreamReader : StreamReader
 {
 private readonly char _replacementCharacter;

 public InvalidXmlCharacterReplacingStreamReader(string fileName, char replacementCharacter)
 : base(fileName)
 {
 _replacementCharacter = replacementCharacter;
 }

 public override int Peek()
 {
 int ch = base.Peek();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 if ('\0' == _replacementCharacter)
 return Peek(); // peek at the next one

 return _replacementCharacter;
 }
 return ch;
 }

 public override int Read()
 {
 int ch = base.Read();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 if ('\0' == _replacementCharacter)
 return Read(); // read next one

 return _replacementCharacter;
 }
 return ch;
 }

 public override int Read(char[] buffer, int index, int count)
 {
 int readCount= 0, ch;

 for (int i = 0; i &lt; count &amp;&amp; (ch = Read()) != -1; i++)
 {
 readCount++;
 buffer[index + i] = (char)ch;
 }

 return readCount;
 }


 private static bool IsInvalidChar(int ch)
 {
 return !XmlConvert.IsXmlChar((char)ch);
 }
 }
</code></pre>

blocks|key|3162897|text|我创建了@Neolisk's+answer的a+slightly+updated+version，它支持*Async函数，并使用.Net+4.0+XmlConvert.IsXmlChar函数。|type|unstyled|depth|inlineStyleRanges|offset|length|style|CODE|entityRanges|data|3162898|public+class+InvalidXmlCharacterReplacingStreamReader+:+StreamReader
{
++++private+readonly+char+_replacementCharacter;

++++public+InvalidXmlCharacterReplacingStreamReader(string+fileName,+char+replacementCharacter)+:+base(fileName)
++++{
++++++++_replacementCharacter+=+replacementCharacter;
++++}

++++public+InvalidXmlCharacterReplacingStreamReader(Stream+stream,+char+replacementCharacter)+:+base(stream)
++++{
++++++++_replacementCharacter+=+replacementCharacter;
++++}

++++public+override+int+Peek()
++++{
++++++++var+ch+=+base.Peek();
++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++{
++++++++++++return+_replacementCharacter;
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read()
++++{
++++++++var+ch+=+base.Read();
++++++++if+(ch+!=+-1+&&+IsInvalidChar(ch))
++++++++{
++++++++++++return+_replacementCharacter;
++++++++}
++++++++return+ch;
++++}

++++public+override+int+Read(char[]+buffer,+int+index,+int+count)
++++{
++++++++var+readCount+=+base.Read(buffer,+index,+count);
++++++++ReplaceInBuffer(buffer,+index,+readCount);
++++++++return+readCount;
++++}

++++public+override+async+Task<int>+ReadAsync(char[]+buffer,+int+index,+int+count)
++++{
++++++++var+readCount+=+await+base.ReadAsync(buffer,+index,+count).ConfigureAwait(false);
++++++++ReplaceInBuffer(buffer,+index,+readCount);
++++++++return+readCount;
++++}

++++private+void+ReplaceInBuffer(char[]+buffer,+int+index,+int+readCount)
++++{
++++++++for+(var+i+=+index;+i+<+readCount+%2B+index;+i%2B%2B)
++++++++{
++++++++++++var+ch+=+buffer[i];
++++++++++++if+(IsInvalidChar(ch))
++++++++++++{
++++++++++++++++buffer[i]+=+_replacementCharacter;
++++++++++++}
++++++++}
++++}

++++private+static+bool+IsInvalidChar(int+ch)
++++{
++++++++return+IsInvalidChar((char)ch);
++++}

++++private+static+bool+IsInvalidChar(char+ch)
++++{
++++++++return+!XmlConvert.IsXmlChar(ch);
++++}
}|code-block|syntax|javascript|3162899|entityMap|0|LINK|mutability|MUTABLE|url|https://stackoverflow.com/a/30351313/1200847|1|https://gist.github.com/georg-jung/6ab5b05ea0ea362c705362b098bc584b#file-invalidxmlcharacterreplacingstreamreader-cs^0|1G|6|21|K|4|H|0|M|Q|1|0|0^^$0|@$1|2|3|4|5|6|7|U|8|@$9|V|A|W|B|C]|$9|X|A|Y|B|C]]|D|@$9|Z|A|10|1|11]|$9|12|A|13|1|14]]|E|$]]|$1|F|3|G|5|H|7|15|8|@]|D|@]|E|$I|J]]|$1|K|3|-4|5|6|7|16|8|@]|D|@]|E|$]]]|L|$M|$5|N|O|P|E|$Q|R]]|S|$5|N|O|P|E|$Q|T]]]]

I created <a href="https://gist.github.com/georg-jung/6ab5b05ea0ea362c705362b098bc584b#file-invalidxmlcharacterreplacingstreamreader-cs" rel="nofollow noreferrer">a slightly updated version</a> of <a href="https://stackoverflow.com/a/30351313/1200847">@Neolisk's answer</a>, which supports the <code>*Async</code> functions and uses the .Net 4.0 <code>XmlConvert.IsXmlChar</code> function.

<pre><code>public class InvalidXmlCharacterReplacingStreamReader : StreamReader
{
 private readonly char _replacementCharacter;

 public InvalidXmlCharacterReplacingStreamReader(string fileName, char replacementCharacter) : base(fileName)
 {
 _replacementCharacter = replacementCharacter;
 }

 public InvalidXmlCharacterReplacingStreamReader(Stream stream, char replacementCharacter) : base(stream)
 {
 _replacementCharacter = replacementCharacter;
 }

 public override int Peek()
 {
 var ch = base.Peek();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 return _replacementCharacter;
 }
 return ch;
 }

 public override int Read()
 {
 var ch = base.Read();
 if (ch != -1 &amp;&amp; IsInvalidChar(ch))
 {
 return _replacementCharacter;
 }
 return ch;
 }

 public override int Read(char[] buffer, int index, int count)
 {
 var readCount = base.Read(buffer, index, count);
 ReplaceInBuffer(buffer, index, readCount);
 return readCount;
 }

 public override async Task&lt;int&gt; ReadAsync(char[] buffer, int index, int count)
 {
 var readCount = await base.ReadAsync(buffer, index, count).ConfigureAwait(false);
 ReplaceInBuffer(buffer, index, readCount);
 return readCount;
 }

 private void ReplaceInBuffer(char[] buffer, int index, int readCount)
 {
 for (var i = index; i &lt; readCount + index; i++)
 {
 var ch = buffer[i];
 if (IsInvalidChar(ch))
 {
 buffer[i] = _replacementCharacter;
 }
 }
 }

 private static bool IsInvalidChar(int ch)
 {
 return IsInvalidChar((char)ch);
 }

 private static bool IsInvalidChar(char ch)
 {
 return !XmlConvert.IsXmlChar(ch);
 }
}
</code></pre>

Is there any easy/general way to clean an XML based data source prior to using it in an XmlReader so that I can gracefully consume XML data that is non-conformant to the hexadecimal character restrictions placed on XML?

Note: 

<ul>
<li>The solution needs to handle XML
data sources that use character
encodings other than UTF-8, e.g. by
specifying the character encoding at
the XML document declaration. Not
mangling the character encoding of
the source while stripping invalid
hexadecimal characters has been a
major sticking point.</li>
<li>The removal of invalid hexadecimal characters should only remove hexadecimal encoded values, as you can often find href values in data that happens to contains a string that would be a string match for a hexadecimal character.</li>
</ul>

Background:

I need to consume an XML-based data source that conforms to a specific format (think Atom or RSS feeds), but want to be able to consume data sources that have been published which contain invalid hexadecimal characters per the XML specification.

In .NET if you have a Stream that represents the XML data source, and then attempt to parse it using an XmlReader and/or XPathDocument, an exception is raised due to the inclusion of invalid hexadecimal characters in the XML data. My current attempt to resolve this issue is to parse the Stream as a string and use a regular expression to remove and/or replace the invalid hexadecimal characters, but I am looking for a more performant solution.

How do you remove invalid hexadecimal characters from an XML-based data source prior to constructing an XmlReader or XPathDocument that uses the data?

在XmlReader中使用基于XML的数据源之前，有没有什么简单/通用的方法来清理它，这样我就可以优雅地使用不符合对XML的十六进制字符限制的XML数据？注意：解决方案需要处理使用除UTF-8之外的字符编码的XML数据源，例如通过在XML文档声明处指定字符编码。在去除无效的十六进制字符的同时不损坏源的字符编码一直是一个...

问在构造使用数据的XmlReader或XPathDocument之前，如何从基于XML的数据源中删除无效的十六进制字符？
EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在构造使用数据的XmlReader或XPathDocument之前，如何从基于XML的数据源中删除无效的十六进制字符？EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在构造使用数据的XmlReader或XPathDocument之前，如何从基于XML的数据源中删除无效的十六进制字符？
EN