首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >XML、HTML和XHTML文档的有效内容类型

XML、HTML和XHTML文档的有效内容类型
EN

Stack Overflow用户
提问于 2010-06-03 19:46:06
回答 1查看 301.9K关注 0票数 148

XML、HTML和XHTML文档的正确内容类型是什么?

我需要写一个简单的爬虫,只获取这些类型的文件。

例如,由于mod_rewrite,现在http://example.net/index.html可以提供JPEG文件,所以我需要检查响应头中的内容类型,并将其与允许的内容类型列表进行比较。

我可以从哪里获得这样的列表?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2010-06-03 20:01:41

HTML:text/html,句号。

XHTML:application/xhtml+xml,或者只有在遵循HTML兼容性准则的情况下,才使用text/html。请参见W3 Media Types Note

XML:text/xmlapplication/xml (RFC 2376)。

还有许多其他基于XML的媒体类型,例如application/rss+xmlimage/svg+xml。可以肯定的是,任何未被识别但已注册的以+xml结尾的内容都是基于XML的。有关以+xml结尾的已注册媒体类型,请参阅IANA list

(对于未注册的x-类型,所有的赌注都是无效的,但您希望+xml会得到尊重。)

票数 245
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2965587

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档