前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >根据站点生成sitemap.xml的脚本

根据站点生成sitemap.xml的脚本

作者头像
zeekling
发布2022-06-17 16:54:10
4720
发布2022-06-17 16:54:10
举报

简介

本人远程服务器上面除了搭建博客之外,还搭建了Gitea私人代码仓库图床服务,但是两个服务上面都没有自带 sitemap.xml,不方便搜索引擎收录对应的链接。于是乎自己写了个脚本用来自动生成 sitemap.xml

使用

项目地址:https://git.zeekling.cn/python/sitemap

  • 安装依赖
代码语言:javascript
复制
pip3 install -r requirement.txt
  • 修改相关参数,下面是我自己使用的一个,供参考:

修改get_url.py

代码语言:javascript
复制
# 当前域名的http链接
url_root = 'https://git.zeekling.cn'
# 需要抓取的根链接,可以多写几个
url_mine_list = [
    'https://git.zeekling.cn/',
    'https://git.zeekling.cn/zeekling'
]
# 抓取的最大栈深度,默认为2,如果网站比较大的话不建议设置太大,可以在url_mine_list多设置url
max_depth = 2
# 不需要写进sitemap.xml的链接
url_robot_arr = [
    '/user/sign_up',
    '/user/login',
    '/user/forgot_password'
]

修改sitemap.xml位置,sitemap.py

代码语言:javascript
复制
# 第一个参数为sitemap.xml的位置
create_xml('sitemap.xml', get_url.url_res_final)
  • 执行脚本
代码语言:javascript
复制
./sitemap.py

执行完成之后就会生成 sitemap.xml

当然为了更新的快一点可以加入到定时任务里面:

代码语言:javascript
复制
0 */6 * * * cd /root/git-sitemap && ./sitemap.py
  • 修改nginx配置,让搜索引擎能够访问得到即可。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020.03.22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 使用
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档