前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >互联网站网页的类型说明

互联网站网页的类型说明

作者头像
田春峰-JCJC错别字检测
发布2021-12-06 10:58:53
4490
发布2021-12-06 10:58:53
举报

互联网站网页的类型说明

在我们使用互联网阅读信息、查找资料的时候,会碰到各种各样的网页,不同的网页类型有着不同的功能,能够对自己浏览的网页进行适当的分类,会对您的工作起到帮助。

比如,JCJC错别字检测系统提供了针对互联网站的错别字检测功能,这项功能提供爬虫服务把目标网站的网页下载到本地,而后进行错别字检测。不同的网页具有不同的结构,不同的结构又影响爬虫的抓取网页的效果。所以了解互联网站的网页类型是一项必备的技能。

下面我们以首都之窗-北京市人民政府门户网站为例进行说明:

总的来说网站中的网页类型分为以下集中:

  • 首页
  • 子网站、频道页
  • 栏目页
  • 搜索结果页
  • 详情页
  • 主题页
  • 网站地图、关于我们

下面我们以此举例说明:

首页

说明:首页是指以 www 开头的域名所在的页面 首页地址通常省略为: /

http://www.beijing.gov.cn/

子网站

说明:子网站一般是指在主域名内的二级域名所指向的内容 比如: 首都之窗的法人服务子网站,二级域名为:http://banshi.beijing.gov.cn/

频道首页

说明:频道页是指在当前域名下的同一内容的页面 比如:首都之窗的政务公开页面: http://www.beijing.gov.cn/gongkai/

搜索结果页

搜索词语:报告 页面地址:http://www.beijing.gov.cn/so/s?tab=all&siteCode=1100000088&qt=%E6%8A%A5%E5%91%8A 说明:搜索结果页的内容都是程序动态生成的,根据用户输入的词语,返回相关的搜索条目,为了更好的提示用户,会对搜索词语进行标红。

详情页

说明:详情页,一般是指承载具体内容的,某一条具体内容所在的文档 比如:这篇新闻:本市发布“文明驾车 礼让行人”倡议书 所在的页面地址:http://www.beijing.gov.cn/ywdt/gzdt/202109/t20210901_2481243.html

网站地图页

说明:网站地图页有两个作用。 1)随着网站内容越来越多,网站结构越来越复杂,针对主要的栏目页面汇总起来,给用户展示 2)网站地图页面一般页面结构简单,网络爬虫也会使用此页面作为抓取网站信息的入口点。

对于JCJC错别字检测系统的网页纠错来说,纠错的内容对象是:详情页

首页、频道页、网站地图、主题页、搜索结果页等都是属于:入口页,通过入口页找到详情页。

以上就是关于网站中网页类型的基础说明。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-09-01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档