我对不转义的文本感兴趣,例如:\
映射到C中的\
。有谁知道好的库吗?
发布于 2009-07-04 13:15:24
今天我有一些空闲时间,从头开始写了一个解码器:entities.c,entities.h。
唯一具有外部链接的函数是
size_t decode_html_entities_utf8(char *dest, const char *src);
如果src
是空指针,字符串将从dest
中获取,即实体将被就地解码。否则,解码后的字符串将被放入dest
中--它应该指向一个足以容纳strlen(src) + 1
字符的缓冲区--而src
将保持不变。
该函数将返回已解码字符串的长度。
请注意,我没有做过任何广泛的测试,所以很有可能会出现bug……
发布于 2012-07-09 23:22:49
对于C中解码这些HTML实体的另一个开源参考,您可以查看命令行实用程序uni2ascii/ascii2uni。相关文件是用于实体查找的enttbl.{c,h}和从UTF32向下转换为UTF8的putu8.c。
发布于 2009-11-17 07:15:56
我编写了自己的无法转义的代码;非常简单,但完成了工作:pn_util.c
https://stackoverflow.com/questions/1082162
复制相似问题