Objective-C / Cocoa Touch中的HTML字符解码

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (15)

首先,我发现了这个:目标C HTML转义/取消转义但这对我没用。

我的编码字符(来自RSS提要)如下所示:&

我在网上到处搜索,发现了相关的讨论,但没有修正我的特定编码,我认为它们被称为十六进制字符。

提问于
用户回答回答于

这些叫做字符实体引用。当他们以…的形式&#<number>;他们被称为数值实体引用。基本上,它是应该被替换的字节的字符串表示形式。如属&#038;,它表示在iso-8859-1字符编码方案中值为38的字符,即&符号必须用RSS编码的原因是它是一个保留的特殊字符。

需要做的是解析字符串并用一个与&#;。我不知道在目标C中有什么很好的方法,但是此堆栈溢出问题可能会有帮助。

用户回答回答于

看看我的HTML的NSString类别。以下是可用的方法:

- (NSString *)stringByConvertingHTMLToPlainText;
- (NSString *)stringByDecodingHTMLEntities;
- (NSString *)stringByEncodingHTMLEntities;
- (NSString *)stringWithNewLinesAsBRs;
- (NSString *)stringByRemovingNewLinesAndWhitespace;

扫码关注云+社区