开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在Google App Engine上拥有robots.txt的开发和生产版本？

在Google App Engine上拥有robots.txt的开发和生产版本，可以通过以下步骤实现：

创建一个名为"robots.txt"的文本文件，其中包含您希望在网站根目录下显示的robots.txt内容。该文件可以包含针对搜索引擎爬虫的指令，以控制它们对网站的访问权限。
在您的应用程序的根目录下创建一个名为"app.yaml"的YAML配置文件。该文件用于配置Google App Engine的应用程序设置。
在"app.yaml"文件中添加以下代码，以将robots.txt文件映射到相应的URL路径：

handlers:
- url: /robots.txt
  static_files: robots.txt
  upload: robots.txt

将"robots.txt"文件和"app.yaml"文件一起部署到Google App Engine上。

在开发环境中，您可以使用Google Cloud SDK提供的命令行工具（如gcloud）将应用程序部署到Google App Engine。具体步骤如下：

打开命令行工具，并导航到包含"robots.txt"和"app.yaml"文件的应用程序目录。
使用以下命令登录到Google Cloud账号：

gcloud auth login

使用以下命令设置要使用的Google Cloud项目：

gcloud config set project [YOUR_PROJECT_ID]

使用以下命令部署应用程序到Google App Engine：

gcloud app deploy

在生产环境中，您可以通过Google Cloud Console进行部署。具体步骤如下：

打开Google Cloud Console（https://console.cloud.google.com）并登录到您的Google Cloud账号。
创建一个新的Google Cloud项目或选择现有的项目。
在Google Cloud Console的导航菜单中，选择"App Engine"。
点击"部署"按钮，选择"代码"选项卡，并上传包含"robots.txt"和"app.yaml"文件的应用程序目录。
点击"部署"按钮，等待部署完成。

完成上述步骤后，您的Google App Engine应用程序将具有可在根目录下访问的robots.txt文件。请注意，这只是一个基本的示例，您可以根据自己的需求自定义robots.txt文件的内容。

相关搜索:Google App Engine上的生产应用突然无法访问Google云存储 Google App Engine标准上的Nodejs版本在带有PHP72和ImageMagick的Google App Engine上可以输出WEBP吗？如何在create-react-app中划分生产和开发版本如何在Facebook的开发者面板上更新/升级Facebook App API版本？我甚至需要这么做？如何在Google App Engine Standard Env for Go中获得request.RemoteAddr和X-AppEngine的输出-国家、地区等？如何在Google App Engine上使用delayed_job和Rails？如何在Google App Engine上查看前端ReactJS的日志？如何在Google App Engine上获取Python FastAPI脚本的CPU和内存使用率如何在Google App Engine上请求我的服务？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

TensorFlow：使用Cloud TPU在30分钟内训练出实时移动对象检测器

是否能够更快地训练和提供对象检测模型？我们已经听到了这种的反馈，在今天我们很高兴地宣布支持训练Cloud TPU上的对象检测模型，模型量化以及并添加了包括RetinaNet和MobileNet改编的RetinaNet在内的新模型。本文将引导你使用迁移学习在Cloud TPU上训练量化的宠物品种检测器。

05

google cloud ：穷人也能玩深度学习

本文介绍了如何使用Google Cloud Platform进行深度学习训练和部署。作者首先介绍了Google Cloud Platform的特点和优势，然后详细讲解了如何利用TensorFlow和Keras在Google Cloud Platform上部署和训练深度学习模型。作者还通过一个实际的案例演示了如何使用Google Cloud Platform进行训练和部署深度学习模型，并分享了在使用过程中需要注意的一些重要细节。

01

google cloud--穷人也能玩深度学习

本文介绍了如何使用Google Cloud Platform进行深度学习训练和部署，包括TensorFlow、Keras、PyTorch等框架的使用。作者通过在Google Cloud Platform中创建项目、配置训练环境、使用Cloud Storage上传数据集、使用TensorFlow训练模型、将模型部署到Cloud Machine Learning Engine中等一系列操作，展示了如何使用Google Cloud Platform进行高效的深度学习训练和部署。

网站页面优化：ROBOTS文件和META ROBOTS

ROBOTS文件（robots.txt）位于网站根目录的文件，也称为机器人排除协议或标准，用于告知搜索引擎网站上的哪些网页要抓取，哪些页面不要抓取。META ROBOTS是一个元标签，可以单独写入到网页中，也是为搜索引擎提供指导读取网站网页的计算机程序。

05

【干货】手把手教你用苹果Core ML和Swift开发人脸目标识别APP

【导读】CoreML是2017年苹果WWDC发布的最令人兴奋的功能之一。它可用于将机器学习整合到应用程序中，并且全部脱机。CoreML提供的机器学习 API，包括面部识别的视觉 API、自然语言处理 API 。苹果软件主管兼高级副总裁 Craig Federighi 在大会上介绍说，Core ML 致力于加速在 iPhone、iPad、Apple Watch 等移动设备上的人工智能任务，支持深度神经网络、循环神经网络、卷积神经网络、支持向量机、树集成、线性模型等。本文将带你从最初的数据处理开始教你一步一步的

06

Robots.txt 协议详解及使用说明

Robots协议，也称为爬虫协议、机器人协议等，其全称为“网络爬虫排除标准（Robots Exclusion Protocol）”。网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。也既是Robots的用法有两种，一种是告诉搜索引擎哪些页面你不能抓（默认其他的就可以抓）；一种是告诉搜索引擎你只能抓取哪些页面（默认其他的不可以抓）。

03

Micronaut：面向未来的微服务和云原生应用框架

原题：MICRONAUT: A JAVA FRAMEWORK FOR THE FUTURE, NOW

02

如何在Ubuntu 12.04上安装和配置AppScale

AppScale是一个开源计算平台，旨在在公共云，私有云和内部部署集群上部署Google App Engine应用程序。AppScale与Google App Engine API完全兼容，并支持Python，Go，PHP和Java。使用AppScale，您可以将现有应用程序迁移到任何云计算平台。您将在下面找到用于为给定API提供服务的开源组件列表。

00

Running Solr on Kubernetes

我们将为搜索工程师介绍在Kubernetes（k8s）上运行Solr的基础知识。具体来说，我们涵盖以下主题：

00

使用 Jenkins X、Kubernetes 和 Spring Boot 实现 CI/CD

过去五年中的变化，如迁移到公有云以及从虚拟机向容器的转变，已经彻底改变了构建和部署软件的意义。

07

WordPress的Robots协议怎么写？附最新Robots.txt文件下载

最近我发现搜索引擎收录了很多“夏末浅笑博客”的重复页面，当然了这跟我前一段时间，将站点根目录下的Robots.txt文件删除掉有直接的关系，Robots.txt文件是一个用来告诉搜索引擎执行Robots协议的文件，我们将Robots协议写在Robots.txt文件里面，告诉搜索引擎我的网站哪些页面可以收录，哪些页面不可以收录。

01

超适合小项目的 K8S 部署策略

Kubernetes 的稳健性、可靠性使它成为现阶段最流行的云原生技术之一，但也有不少用户反映， Kubernetes 技术学习起来十分复杂，只适用于大集群且成本较高。这篇文章将打破你的观念，教你在小型项目中部署 Kubernetes 集群。

03

WordPress网站robots.txt怎么写及要注意的地方

WordPress网站robots.txt怎么写？robots.txt是网站很重要的一个组成部分。它告诉搜索引擎什么文件可以抓取，什么文件不能抓取。它是搜索引擎和网站之间一个默许的协议，由搜索引擎自觉遵守，，用文本文档来实现，放在robots.txt中。很多新手只知道服务器运维、建设wordpress网站内容、发外链、加友链，却不知道在网站建设初期及正常上线后最重要的robots.txt文件，所以对新手来说，本文内容很重要，建议大家好好看看，这里面有魏艾斯博客自己的体会。

06

Robots.txt指南

当搜索引擎访问一个网站时，它首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。Robots.txt文件用于限定搜索引擎对其网站的访问范围，即告诉搜索引擎网站中哪些文件是允许它进行检索(下载)的。这就是大家在网络上常看到的“拒绝Robots访问标准”(Robots Exclusion Standard)。下面我们简称RES。 Robots.txt文件的格式：Robots.txt文件的格式比较特殊，它由记录组成。这些记录通过空行分开。其中每条记录均由两个域组成：　　1) 一个User-Agent(用户代理)字符串行；　　2) 若干Disallow字符串行。　　记录格式为：<Field> ":" <value> 　　下面我们分别对这两个域做进一步说明。 User-agent(用户代理)：　　User-agent行(用户代理行) 用于指定搜索引擎robot的名字，以Google的检索程序Googlebot为例，有：User-agent: Googlebot 　　一个robots.txt中至少要有一条User-agent记录。如果有多条User-agent记录，则说明有多个robot会受到RES标准的限制。当然了，如果要指定所有的robot，只需用一个通配符"*"就搞定了，即：User-agent: * Disallow(拒绝访问声明)：　　在Robots.txt文件中，每条记录的第二个域是Disallow:指令行。这些Disallow行声明了该网站中不希望被访问的文件和(或)目录。例如"Disallow: email.htm"对文件的访问进行了声明，禁止Spiders下载网站上的email.htm文件。而"Disallow: /cgi-bin/"则对cgi-bin目录的访问进行了声明，拒绝Spiders进入该目录及其子目录。Disallow声明行还具有通配符功能。例如上例中"Disallow: /cgi-bin/"声明了拒绝搜索引擎对cgi-bin目录及其子目录的访问，而"Disallow:/bob"则拒绝搜索引擎对/bob.html和/bob/indes.html的访问(即无论是名为bob的文件还是名为bob的目录下的文件都不允许搜索引擎访问)。Disallow记录如果留空，则说明该网站的所有部分都向搜索引擎开放。空格 & 注释　　在robots.txt文件中，凡以"#"开头的行，均被视为注解内容，这和UNIX中的惯例是一样的。但大家需要注意两个问题：　　1) RES标准允许将注解内容放在指示行的末尾，但这种格式并不是所有的Spiders都能够支持。譬如，并不是所有的Spiders都能够正确理解"Disallow: bob #comment"这样一条指令。有的Spiders就会误解为Disallow的是"bob#comment"。最好的办法是使注解自成一行。　　2) RES标准允许在一个指令行的开头存在空格，象"Disallow: bob #comment"，但我们也并不建议大家这么做。 Robots.txt文件的创建：　　需要注意的是，应当在UNIX命令行终端模式下创建Robots.txt纯文本文件。好的文本编辑器一般都能够提供UNIX模式功能，或者你的FTP客户端软件也“应该”能够替你转换过来。如果你试图用一个没有提供文本编辑模式的HTML编辑器来生成你的robots.txt纯文本文件，那你可就是瞎子打蚊子——白费力气了。对RES标准的扩展：　　尽管已经提出了一些扩展标准，如Allow行或Robot版本控制(例如应该忽略大小写和版本号)，但尚未得到RES工作组的正式批准认可。附录I. Robots.txt用法举例：　　使用通配符"*"，可设置对所有robot的访问权限。　　User-agent: * 　　Disallow: 　　表明：允许所有搜索引擎访问网站下的所有内容。　　User-agent: * 　　Disallow: / 　　表明：禁止所有搜索引擎对网站下所有网页的访问。　　User-agent: * 　　Disallow: /cgi-bin/Disallow: /images/ 　　表明：禁止所有搜索引擎进入网站的cgi-bin和images目录及其下所有子目录。需要注意的是对每一个目录必须分开声明。　　User-agent: Roverdog 　　Disallow: / 　　表明：禁止Roverdog访问网站上的任何文件。　　User-agent: Googlebot Disallow: cheese.htm 　　表明：禁止Google的Googlebot访问其网站下的cheese.htm文件。　　上面介绍了一些简单的设置，对于比较复杂的设置，可参看一些大型站点如CNN或Looksmart的robots.txt文件(www.cnn.c

02

使用 Jenkins X、Kubernetes 和 Spring Boot 实现 CI/CD

过去五年中的变化，如迁移到公有云以及从虚拟机向容器的转变，已经彻底改变了构建和部署软件的意义。

01

BurpSuite系列(三)----Spider模块(蜘蛛爬行)

Burp Spider 是一个映射 web 应用程序的工具。它使用多种智能技术对一个应用程序的内容和功能进行全面的清查。

03

Robots.txt和Robots META

robots.txt是一套指示搜索引擎（蜘蛛）如何抓取你的网页内容的一张地图，他告诉蜘蛛哪些需要抓取，哪些不要抓取（当然，这只是针对那些遵守这个协定的搜索引擎）。robots.txt文件必须存放在网站的根目录下。

02

安全工具系列 -- 信息收集

信息收集一般都是渗透测试前期用来收集，为了测试目标网站，不得不进行各种信息收集。信息收集要根据不同目标进行不同方向收集，工具部分会在下节课程进行讲解，根据个人渗透测试经验总结文章。本文只是抛砖引玉，希望可以给大家一个好的思路。如果文章中有环境搭建部分，靶场后续会在公众号中发布。视频在关注公众号以后，回复我要视频，管理员会在最快时间进行回复。

02

认识Service Mesh(1): Deploy Istio on Kubernetes with GKE

关注容器圈的朋友一定会注意到最近一年的高频词：Service Mesh。这么绕口的词，到底是什么意思？引用一篇文章里对其的解释：

03

Jenkins 和 Kubernetes 云上的神秘代理

最近我们构建和部署服务的方式与原来相比简直就是突飞猛进，像那种笨拙的、单一的、用于构建单体式应用程序的方式已经是过去式了。我们努力了这么久，终于达到了现在的效果。现在的应用为了提供更好的拓展性和可维护性，都会去拆解成各种相互依赖小、解耦性强的微服务，这些服务有各自的依赖和进度。如果你想去构建你所负责的服务，那么从一开始，就应该使用 CI/CD 的方式；当然，如果你走上了这条路， Jenkins 就是你的良师益友。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭