首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

云计算下的企业IT运维

收集云计算性能指标 IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。...当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数: CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。...还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。...通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。 工作流程自动化的优势   主动云计算工作负载监控可执行收集指标和统计数据的任务。...当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。

2.1K30

Linkerd 2.10将支持不透明端口

简单地说,协议检测是通过检查连接上的流量来确定TCP连接上使用的协议的能力。 ? 协议检测 Linkerd使用协议检测来避免要求用户指定协议。...这里的一个例子是负载平衡。在不知道连接的协议的情况下,Linkerd被限制在平衡连接:一旦TCP连接建立到服务器,它就没有进一步操作该连接的能力。...由于它现在可以访问请求和响应,Linkerd在如何平衡请求方面可以非常复杂;事实上,它根据每个可能端点的最近性能来平衡请求(使用一种称为“指数加权移动平均”(EWMA)的指标),以避免缓慢端点带来尾部延迟...因为在协议检测时,Linkerd甚至还没有建立到服务器的连接。选择与哪个服务器通信是负载均衡器的功能,使用哪个负载均衡器是协议的功能。这是一个美味的、TCP风味的“鸡和蛋”问题。)...(想要尝试不透明的端口吗?你不必等待2.10的发布,因为该功能目前已经在edge发布版中可用!) Linkerd适用于所有人 Linkerd是一个社区项目,由CNCF托管。

73640
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Server-Speaks-First 有点坑,Linkerd 2.10 中的协议检测和不透明端口

    简而言之,协议检测是通过检查连接上的流量来确定 TCP 连接上使用的协议的能力。 Linkerd 使用 Protocol detection 来避免要求用户指定协议。...这里的一个例子是负载平衡。在不知道连接协议的情况下,Linkerd 仅限于平衡连接(balancing connections):一旦与服务器建立了 TCP 连接,它就无法进一步操作该连接。...moving average)”或 EWMA 的指标)来平衡请求,以避免从慢速端点引起尾部延迟(tail latency)。...( Linkerd 也是 Kubernetes 中负载平衡 gRPC 连接的一个简单解决方案。)...因为在检测协议的时候,Linkerd 甚至还没有建立到服务器的连接。选择与哪个服务器对话是负载均衡器的一个功能,而使用哪个负载均衡器是协议的一个功能。

    56820

    分布式PostgreSQL基准测试:Azure Cosmos DB、CockroachDB和YugabyteDB

    这是一个用于对关系型数据进行基准测试的开源工具,由事务性能委员会(Transaction Performance Council,缩写为 TPC)负责管理。...在最初的基准测试中,GigaOM 使用了 1000 个仓库,产生了大约 100GB 的数据。然而,CockroachDB 和 Yugabyte 的吞吐量之低令人惊讶。...我们的经验是,如果不对相关数据做协同定位,那么传统的事务型 PostgreSQL 工作负载的性能将比单个服务器差许多。...YugabyteDB 开发大使 Franck Pachot 在推特上谈到了这项基准测试,他提了一个问题: 这是比较 Citus(通过两阶段提交协议在 SQL 数据库上实现的分片)与 YugabyteDB...为了鼓励客户运行与其工作负载相匹配的基准测试,微软共享了辅助脚本,以便他们可以在 Azure Cosmos DB 上运行 HammerDB 基准测试。

    30620

    分布式应用的 4 个核心可观测性指标

    由于足够大的微服务集需要某种程度的协调,我们将假设使用 Kubernetes 进行编排。我们还假设有一个时间序列数据库,如 Prometheus 或 InfluxDB,用于存储我们的指标数据。...end end 这不应仅限于捕获整个端点请求/响应周期。这种延迟跟踪太广泛了,应该更细化。假设我们有一个带有发出内部数据库请求的端点的微服务。...但是,有许多工具可用于使用 Kubernetes 进行跟踪。 实施监控和可观察性 到目前为止,我们已经讨论了在云应用程序中跟踪很重要的指标类型。...结论 每当我们需要调查恶化的性能时,我们的影响数据指标都可以帮助我们确定问题的严重程度:它应该告诉我们有多少人受到影响。同样,我们的因果数据确定什么不起作用以及为什么。...如果我们已经在集群旁边运行 Kong,那么像这样的插件直接与 Prometheus 集成,这意味着我们可以减少用于监控和存储服务指标的配置。

    1.5K30

    介绍两款k8s dashboard

    在 event选项卡中,Infra App将自动获取与此工作负载有关的所有相关事件-例如卷,端点,控制器等。 YAML标签。YAML选项卡将显示用于设置工作负载的YAML文件。 主要配置。...在主要配置详细信息中,您将找到工作负载的种类,与之关联的名称空间,其创建日期,工作负载附带的标签以及该工作负载当前正在使用的映像。 利用率。...对于CPU /内存利用率,Infra App通过查看Kubernetes指标终结点自动检测您是否已安装指标服务器。 pod。在pod选项中,您将能够看到所有相关pod的列表及其当前状态。 pod动作。...在通过 ...按钮的操作下拉列表中,您将能够在单个容器上执行操作,例如对特定容器打开shell,从容器中查看日志以及删除容器。 服务。在服务部分,您将能够看到服务的类型及其端点。...Infra App使端点超链接,因此您可以单击它以在Web浏览器中查看结果(如果支持)。 ConfigMaps。

    1.8K10

    SpringBoot actuator 应用监控。

    度量指标类:获取应用程序运行过程中用于监控的度量指标,比如内存信息、线程池信息、HTTP请求统计等。 操作控制类:提供了对应用的关闭等操作类功能。...2.2 度量指标类 上面我们所介绍的应用配置端点类所提供的信息报告在应用启动的是否就已经基本确定了其返回内容,可以说是一个静态报告。...而度量指标类端点提供的报告内容则是动态变化的,这些端点提供了应用程序在运行过程中一些快照信息,比如内存使用情况、HTTP请求统计、外部资源指标等。...从上面的示例中,我们看到有如下这些重要的度量值: 系统信息:包括处理器数量processors、运行时间uptime和instance.uptime、系统平均负载systemload.average。.../health:该端点用来获取应用的各类健康指标信息。在spring-boot-starter-actuator模块中自带实现了一些常用资源的健康指标检测器。

    2K10

    SpringCloud 优雅下线+灰度发布

    在 Spring Cloud 中,Ribbon 做负载均衡时,只会负载到标记为UP的实例上。...但这种方式也有很多缺点,例如: 没有一个确定 OK 的环境。使用蓝绿部署,我们能够清晰地知道老版本是 OK 的,而使用滚动发布,我们无法确定。 修改了现有的环境。 如果需要回滚,很困难。...我们来看一下金丝雀部署的步骤: 准备好部署各个阶段的工件,包括:构建工件,测试脚本,配置文件和部署清单文件 从负载均衡列表中移除掉“金丝雀”服务器 升级“金丝雀”应用(切断原有流量并进行部署) 对应用进行自动化测试...将“金丝雀”服务器重新添加到负载均衡列表中(连通性和健康检查) 如果“金丝雀”在线使用测试成功,升级剩余的其他服务器(否则就回滚) 在金丝雀部署中,常常按照用户量设置路由权重,例如 90% 的用户维持使用老版本...不同版本应用共存,经常与 A/B 测试一起使用,用于测试选择多种方案。

    46020

    【K8s】Kubernetes 网络之 CoreDNS

    基本介绍 CoreDNS 是一种使用 Golang 编写、由配置文件控制的插件式 DNS 服务器,自 Kubernetes 1.13 版本起,成为 Kubernetes 的默认 DNS 服务器,通常用于...各类插件用于处理 DNS 请求、转发请求、缓存结果、记录日志等。CoreDNS 具有高性能、自动重试、健康检查和负载均衡等功能,确保了 DNS 服务的可靠性。...health:该插件用于提供 CoreDNS 的健康报告,会在 http://localhost:8080/health 处提供健康检查端点 lameduck 5s:health 插件的一个选项,表示当...的度量指标值 forward:该插件用于将不在 Kubernetes 集群域内的任何查询转发到预定义的解析器(通常是 /etc/resolv.conf 中指定的 DNS 服务器) max_concurrent...10000:设置最大并发请求的数量为 10000 cache:该插件用于启用前端缓存,缓存查询结果 30 秒,以减少对外部 DNS 服务器的请求负载 loop:该插件用于检测简单的转发环,如果发现死循环

    17910

    BUG预警-6款好用的API监控工具

    我们可以调查端点的性能,快速找到失败的客户请求,并在新环境中测试不同的配置。现在我们已经讨论了API监控的重要因素和API指标,我们可以看看一些好用的API监控工具。...如果我们使用云Postman,则可以在云服务器中运行、查看和安排每个集合的API请求。然后,我们可以过滤结果并查看显示每个测试响应时间的图表。...最后,Uptrends提供了30天的免费试用期,以确定它是否是正确的软件。但是,直到大约37美元/月的商业订阅计划才包括API监控。 3....相反,Loggly 用于解析、搜索、组织、查看和分析日志数据。因此,Loggly是一个可以访问API日志的工具,它可能是从功能测试中创建的,并允许用户查看数据。...然后,我们讨论了我们应该何时开始寻找合适的工具并完成工具集成。接着,我们概述了API监控工具应收集的用于分析和错误检测的指标和分析。最后,我们列出了市面上好评较多的API监控工具。

    3K20

    前沿观察 | 分布式SQL性能对比

    读和写在Aurora中是单独分开的节点在执行。为了进行读扩展,应用程序要负责从多个读端点中进行显式地读取。 ? 首先,这意味着应用程序需要在设计中明确包含要连接的端点。...这可以通过以下方式改善性能: 应用程序只需要连接到集群中的一个随机节点,其余的由数据库处理。数据库的所有节点都可以放在一个负载均衡器后面。...用集群感知的JDBC驱动程序消除负载均衡器 为了进一步简化操作,我们正在研究标准JDBC驱动程序的集群感知版本,称为YugabyteDB JDBC。...这成为两种设计的基本架构折衷,因此在选择之前需要仔细考虑。但是原始性能数据是什么样的呢?为了确定这一点,我们执行了一个基准测试,将500万唯一键值数据插入到一个具有非聚集索引列的数据库表中。...注意,本节中的分析仅适用于写入事务,读取不受此分析影响。 未来的工作 我们正在做很多进一步的优化和改进。 眼下已经可以实现的一条就是改进YSQL的性能使之与YCQL相当。 更改YSQL的连接处理架构。

    2.2K10

    「列式数据库」与其他数据库相比较,YugabyteDB太强了

    YugabyteDB是什么? YugabyteDB是一个高性能的分布式SQL数据库,用于支持全球的、因特网规模的应用程序。...YugabyteDB使用高性能文档存储、每个碎片分布式一致复制和多碎片ACID事务的独特组合(灵感来自谷歌Spanner)构建,它同时提供扩展的RDBMS和因特网规模的OLTP工作负载,具有低的查询延迟...作为云本地数据库,它可以跨公共和私有云部署,也可以轻松地部署在Kubernetes环境中。 YugabyteDB是作为一个Apache 2.0开源项目开发和发布的。...开放源码中还包含了一些新特性,比如Change Data Capture (CDC)和2个数据中心部署。 YugabyteDB支持如下特性: 线性可伸缩性 可用于读写的可靠、快速扩展。...查看YugabyteDB与分布式SQL和NoSQL类别中的其他操作数据库的比较。要获得详细的比较,请单击数据库名称。 分布式SQL数据库 ? NoSQL databases ?

    3.4K30

    云计算下的企业IT运维

    收集云计算性能指标   IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。...当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数:   CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。...还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。...通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。 工作流程自动化的优势   主动云计算工作负载监控可执行收集指标和统计数据的任务。...当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。

    2K60

    谷歌 AI 推出“不确定性基线库”,用于深度学习中的不确定性和鲁棒性

    机器学习一直是当今技术中的热门词。它越来越多地用于各种实际应用,例如图像和语音识别、自动驾驶汽车、医学诊断等。因此了解其在实践中的行为和性能变得非常重要。...这些是针对各种任务的标准和最先进的深度学习方法的高质量实现的集合。该集合跨越九个任务的十九个方法,每个任务至少有五个指标。 基线在一般情况下,被定义为一个数字,是用于比较研究合理的和定义的起始点。...每个基线的超参数都经过多次迭代训练,以提供超越结果的结果。 在这项研究中,不确定性基线提供了 83 条基线,其中包含 19 种方法,包括更多最新策略。...评估指标:预测指标(如准确性)、不确定性指标(如校准误差)、计算指标(如推理延迟)。 为了能够轻松使用这些基线,它们被有意优化为尽可能最小化和模块化。不是建立新的类抽象,而是使用预先存在的抽象。...训练/评估管道包含在用于特定实验的独立 python 文件中,以确保不同基线之间的独立性。它可以在 TensorFlow、PyTorch 或 JAX 中的任何一个中开发。

    82510

    Spring Cloud 优雅下线以及灰度发布

    在 Spring Cloud 中,Ribbon 做负载均衡时,只会负载到标记为UP的实例上。...但这种方式也有很多缺点,例如: 没有一个确定 OK 的环境。使用蓝绿部署,我们能够清晰地知道老版本是 OK 的,而使用滚动发布,我们无法确定。 修改了现有的环境。 如果需要回滚,很困难。...我们来看一下金丝雀部署的步骤: 准备好部署各个阶段的工件,包括:构建工件,测试脚本,配置文件和部署清单文件 从负载均衡列表中移除掉“金丝雀”服务器 升级“金丝雀”应用(切断原有流量并进行部署) 对应用进行自动化测试...将“金丝雀”服务器重新添加到负载均衡列表中(连通性和健康检查) 如果“金丝雀”在线使用测试成功,升级剩余的其他服务器(否则就回滚) 在金丝雀部署中,常常按照用户量设置路由权重,例如 90% 的用户维持使用老版本...不同版本应用共存,经常与 A/B 测试一起使用,用于测试选择多种方案。

    1.9K20

    Nginx负载均衡中后端节点服务器健康检查的操作梳理

    正常情况下,nginx做反向代理,如果后端节点服务器宕掉的话,nginx默认是不能把这台realserver踢出upstream负载集群的,所以还会有请求转发到后端的这台realserver上面,这样势必造成网站访问故障...虽然nginx可以在localtion中启用proxy_next_upstream来解决返回给用户的错误页面,如下: 例如公司的网站访问的时候全部变成404页面,最后发现是后端的一台服务器不可用,直接访问那台后台的服务器的时候...配置如下: location / { #如果后端的服务器返回502、504、执行超时等错误,自动将请求转发到upstream负载均衡池中的另一台服务器,实现故障转移。...: 上面的nginx负载均衡配置中已经开启了cache缓存功能,如果不需要缓存功能,则将上面vhosts目录下的虚拟主机配置中的proxy_cache mycache及其下面三行注释即可!...说明: 该域名的访问请求都打到了后端好着的那台服务器上了,那台关闭的服务器已经从upstream负载中踢出去了。

    4.8K101

    大规模分析您的 Prometheus 指标: Prometheus + Elasticsearch

    Prometheus是一个开源的监测平台。Prometheus 是一款主要用于监测容器化工作负载的热门工具,它使用开放的、独立于供应商且基于文本的公开格式,从已装载测量工具的作业中收集时序数据。 ...通过白盒能够了解其内部的实际运行状态,通过对监控指标的观察能够预判可能出现的问题,从而对潜在的不确定因素进行优化。...在撰写本文时,Prometheus 服务器、Alertmanager 以及官方导出工具均只支持实验性的 HTTP 端点 TLS 加密功能。...,您连接至 Prometheus 服务器并通过 /metrics 端点或者 Prometheus 联合 API 提取业已采集的指标,即可开始。...您可以使用 Metricbeat 从环境中的每个 Prometheus 服务器上采集性能指标并加以存储。

    4K62

    详细了解 Linkerd 2.10 基础功能,一起步入 Service Mesh 微服务架构时代

    负载均衡:Linkerd 会自动对 HTTP、HTTP/2 和 gRPC 连接上所有目标端点的请求进行负载平衡。 多集群通信:Linkerd 可以透明且安全地连接运行在不同集群中的服务。...由于此 annotation 通知被 mesh 的 clients 的行为, 因此它可以应用于使用服务器优先(server-speaks-first)协议的服务,即使服务本身没有被网格。...这种负载平衡可以改善端到端(end-to-end)延迟。 服务发现 对于不在 Kubernetes 中的目的地,Linkerd 将在 DNS 提供的端点之间进行平衡。...如果 IP 地址对应于一个服务,Linkerd 将在该服务的端点之间进行负载平衡, 并应用该服务的服务配置文件中的任何策略。..., 尤其是用于识别瓶颈和了解系统中每个组件的延迟成本。

    1.4K60
    领券