首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在C中解码HTML实体?

如何在C中解码HTML实体?
EN

Stack Overflow用户
提问于 2009-07-04 12:54:21
回答 5查看 13.6K关注 0票数 20

我对不转义的文本感兴趣,例如:\映射到C中的\。有谁知道好的库吗?

参考维基百科的List of XML and HTML Character Entity References

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2009-07-04 13:15:24

今天我有一些空闲时间,从头开始写了一个解码器:entities.centities.h

唯一具有外部链接的函数是

size_t decode_html_entities_utf8(char *dest, const char *src);

如果src是空指针,字符串将从dest中获取,即实体将被就地解码。否则,解码后的字符串将被放入dest中--它应该指向一个足以容纳strlen(src) + 1字符的缓冲区--而src将保持不变。

该函数将返回已解码字符串的长度。

请注意,我没有做过任何广泛的测试,所以很有可能会出现bug……

票数 38
EN

Stack Overflow用户

发布于 2012-07-09 23:22:49

对于C中解码这些HTML实体的另一个开源参考,您可以查看命令行实用程序uni2ascii/ascii2uni。相关文件是用于实体查找的enttbl.{c,h}和从UTF32向下转换为UTF8的putu8.c。

uni2ascii

票数 1
EN

Stack Overflow用户

发布于 2009-11-17 07:15:56

我编写了自己的无法转义的代码;非常简单,但完成了工作:pn_util.c

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1082162

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档