展开

关键词

ACP互联网架构认证笔记-ARMS业务实时服务

应用实例调用信息 概览 SQL 分析 异常分析 接口快照 前端专注于 Web 端体验,从页面打开速度(测速)、页面稳定性(JS Error)和外部服务调用成功率(API)这三个方面源(日志源)为 ARMS 提供流入,您可以通过各种方式将推送到 ARMS 实时计算引擎。 云服务器 ECS,通过 Logtail Agent 完成在 ECS 上的增量推送,例如日志文件。 适用场景包括应用运行在阿里云 ECS 上的所有业务场景。 LogHub 源,将阿里云日志服务(SLS LogHub)作为 AMRS 的源输入。 如果 ECS 上的日志已经被阿里云 LogHub 收集,那么可以用此方法让 ARMS 复用 LogHub上的。 API 源,通过 API SDK 向 ARMS 直接推送日志。 适用于不适合装 Agent 但是可以通过 API 集成来直接推送收集场景,例如移动终端。 MQ 源,通过对接 MQ 直接拉取 Topic 内消息并基于其内容进行实时统计,进行业务

7220

什么是 ECS ?

云服务器(Elastic Compute Service) 云服务器(Elastic Compute Service,简称ECS)是阿里云提供的性能卓越、稳定可靠、弹性扩展的 IaaS(Infrastructure 云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。 阿里云ECS持续提供创新型服务器,解决多种业务需求,助力您的业务发展。选择云服务器ECS,您可以轻松构建具有以下优势的计算资源:无需自建机房,无需采购以及配置硬件设施。 快速接入部署在全球范围内的中心和BGP机房。成本透明,按需使用,支持根业务波动随时扩展和释放资源。提供GPU和FPGA等异构计算服务器、弹性裸金属服务器以及通用的x86架构服务器。 提供虚拟防火墙、角色权限制、内网隔离、防病毒攻击及流量等多重安全方案。提供性能框架和主动运维体系。提供行业通用标准API,提高易用性和适用性。云服务器ECS的产品组件架构图 ?

1.3K30
  • 广告
    关闭

    11.11智惠云集

    2核4G云服务器首年70元,还有多款热门云产品满足您的上云需求

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    ACP互联网架构认证笔记-EDAS企业级分布式应用服务

    EDAS 鹰眼系统能够分析分布式系统的每一次系统调用、消息发送和库访问。 EDAS 能够针对应用的运行状态,对机器的CPU、内存、负载(Load)、网络和磁盘等基础指标进行详细的。EDAS还提供容器功能(应用诊断)。 基础(可提供以应用为维度的)面向的是机器,容器面向是应用所在的容器。基础存在时延,容器基本是实时的。 VPC环境调用链和需要有访问请求流量才会产生,如果无客户访问网站,则不会有曲线。确定机器的8182端口打开。执行 netstat -antp|grep 8182查看是否端口开放。 对EDAS应用进行服务、治理、跟踪、分析等全方位运维管理。 EDAS高级版的流量管理规则有两种模式 : 参取模和名单分流。通常用于灰度发布,蓝绿部署,AB 测试,营销需求(新产品发布)。

    94370

    MQ45# 实战|RocketMQ不同可用区导致消费不均衡

    原来部署到ECS上的服务没有积压情况,准备往容器迁移。下面是业务同学做的排除测试,另外容器当前在JK可用区部署,而MQ集群部署在BGF区。 回退到原ECS部署积压消失在原可用区申请扩容ECS未出现积压在新的可用区JK申请ECS出现积压备注: 很明显该积压与可用区有关系。 二、积压在迁移容器的过程中,同时有容器消费和ECS消费的节点,通过分区积压进行对比。ECS消费分区积压备注: 明显ECS的节点没有什么积压。 容器消费分区积压备注: 积压较多的分区分布在容器节点。三、可用区耗时JF可用区延迟 GBK可用区延迟备注: JK区的延迟比其他可用区多0.5ms左右。

    7410

    用“弹性伸缩”需了解客户什么信息?

    一、什么是弹性伸缩能力 管理员可以自由设置,当cpu、内存等当前值高于某阀值时,自动增加ECS云主机。当低于某阀值时,自动减少ECS云主机。? 二、为什么不能任意使用弹性伸缩服务举个例子,如果某客户正在使用IE浏览器访问某ECS云主机上的网站,并用帐号密码登录了该网站,而该ECS主机因负载较低被弹性伸缩服务强制退出,那么该客户的登录状态将断开, 三、如何才能正常使用弹性伸缩服务就上面的例子,如果用户的登录状态Session没有在ECS云主机上存储,而是放在了共享存储中,如RDS库中。 即使ECS被强制下线,客户业务被重新分配到另一台ECS中进行业务使用,登录状态仍然能够在RDS中被找回,客户业务不会中断。 总结,如果需要使用弹性伸缩服务,客户的业务必须进行改造,将云主机上存储的有状态化的(如Session)移植到RDS、Redis等共享存储中,简称需要“业务无状态化”。

    28030

    高并发口罩抢购项目架构演进记录&优化经验分享

    2月2号晚上22点左右的原始架构客户端走 HTTPS 协议直接访问 ECSECS 上使用 Nginx 听 HTTPS 443 端口;Nginx 反代 Tomcat,Nginx 处理静态文件,Tomcat 处理动态请求;程序先去 Redis 查缓存,如未命中则去库查询,同时Redis 与 Mysql 之间的同步靠程序制。 2月3号早上9点左右的架构接入 SLB,通过镜像横向扩展负载能力;接入读写分离库架构,通过阿里云库自动进行读写分离,自动同步;调整 Nginx 协议;同架构备集群启用(域名解析做了两个A记录 最后的成果统计(采样分析,实际比这个还大):? 反代后端 upstream 无效端口去除;云助手批量处理服务,参优化,添加实例标识;(划重点,大家批量使用 ECS,可以考虑利用云助手这个产品)云大盘ECS、SLB、DCDN、Redis等

    23340

    kubernetes从懵圈到熟练 – 集群伸缩原理

    这条命令使用curl下载attach_node.sh脚本,然后以openapi token为参,在ECS上运行。 读即收集,写即节点配置。?这里的读写过程,绝大部分都很基础,大家可以通过阅读脚本来了解细节。唯一需要特别说明的是,kubeadm join把节点注册到Master的过程。 其中第一个过程,主要用来配置节点的规格属性,包括设置节点的用户。这个用户和手动添加已有节点的脚本类似,不同的地方在于,其针对自动伸缩这种场景,增加了一些专门的标记。 理论上来说,我们可以把这个组件当做一个制器。因为它的作用与制器类似,基本上还是听Pod状态,以便在Pod因为节点资源不足而不能被调度的时,去修改ESS的伸缩规则来增加新的节点。 首先,通过添加已有节点加入的节点,需要三步去移除:管通过ECS API清楚ECS userdata;管通过K8S API从集群中删除节点;管通过ECS InvokeCommand在ECS上执行kubeadm

    33630

    处理网络超时问题的最佳实践

    本文会从云基础设施层和业务软件层对业务超时做分析,总体来讲基础设置层面的丢包原因相对容易排查,阿里云有完善的底层,根业务日志报错的对应时间段,从中可以确定是否有基础设施网络问题。 当云产品的流量或者连接超过规格或者带宽限制时,也会出现丢包。这种丢包并非云厂商的故障,而是实际业务流量规模和选择云产品规格时的偏差所带来。这种问题通常从云产品提供的中就能分辨出来。 排查思路根基本思路,先从中查看ECS实例及链路有没有丢包。结果发现并没有能和业务日志中出现timeout报错时间点吻合的丢包。在这种情况下,只能进一步利用问题复现时的抓包来一探究竟了。 ECS内网访问自建Redis超时的例子ECS访问云服务RDSCache或者自建库Cache超时是另外一类问题,下面用一个ECS内网访问字节Redis超时来说明这类问题。 根基本思路,先从中查看ECS实例及链路有没有丢包。结果发现并没有能和Read timed out报错时间点吻合的丢包。进一步利用问题复现时的抓包来一探究竟了。

    1.1K30

    5 分钟学会写一个自己的 Prometheus Exporter

    Exporter何为 Prometheus ExporterPrometheus 基于一个很简单的模型: 主动抓取目标的指标接口(HTTP 协议)获取指标, 再存储到本地或远端的时序库. ”; 整合业务: 业务的信息存在于另一套系统中, 两套系统的看板, 警报都很难联动;幸好, 云提供了获取信息的 API, 那么我们很自然地就能想到: 只要写一个阿里云云的 Exporter 而对于阿里云 Exporter 而言, 由于阿里云有十种类型的资源(RDS, ECS, SLB…), 因此我们无法推测用户到底希望抓哪些信息, 因此只能全部交给用户配置. , 仅仅记录 ecs 的一些额外信息. , 因此阿里云 exporter 里还记录了各种抓取请求的次和响应时间的分布, 分别用于做用量的规划和基于响应时间的报警.

    1.5K10

    使用 Elastic Stack 构建 Kubernetes 全栈(24)

    由于会产生大量的,很有可能一天就超过几十G的,所以为了防止大量的存储,我们可以利用 indice 的生命周期来配置保留,这个在 Prometheus 中也有类似的操作。 如下所示的文件中,我们配置成每天或每次超过5GB的时候就对 indice 进行轮转,并删除所有超过10天的 indice 文件,我们这里只保留10天完全足够了。 在 Kibana 左侧页面 Observability → Metrics 进入指标页面,正常就可以看到一些了:? 我们还单独启用了 mongodb 模块,我们可以使用 Overview ECS 这个 Dashboard 来查看信息:? 我们还启用了 docker 这个模块,也可以使用 Overview ECS 这个 Dashboard 来查看信息:?

    34710

    视频logo处理-1:机型选择与成本

    目录(1).资源要求(2).测试环境(3).过往经验正文前提:小视频。视频越大,资源要求越多。 要求:单机清理一万个视频的logo天(1).资源要求选择2台:32核,64G的ECS机器,最少支持2万视频的处理天,这个量是最低量,服务器不会有压力,做好(zabbixprometheus)后不断调整各项参 机型选择阿里云ECS的ecs.sn1ne.8xlarge(32cpu,64GB,计算网络增强型)。?依见后。 (2).测试环境是2核机器,没有跑几个视频load就卡死了,注意Load与cpu核。?(3).过往经验之前公司我们用的是5台24核*128G的机器去处理小视频,一台每天能转1w,大致。 注意CPU核和Load。?

    22440

    Zabbix 5.2.6 MySQL库 表结构

    趋势 趋势的趋势方式是对应项目的历史在一个小时内的平均值、最大值、最小值以及这一个小时内该项目所采集到的的个。 所以不管一个项目的更新间隔是多少,它所对应的趋势库中的记录都只有一条(每小时)。更新间隔越小,仅可能导致历史增大,而不会影响该项目在趋势表里的记录条的。 注意 如果项目的“保留历史(天)”配置项被设置成0时,则库历史表中仅保留该项目所采集的最后一条,其它历史将不会被会保留。 history_log 存储信息类型为日志的项历史history_str 存储信息类型为字符的项历史history_text 存储信息类型为文本的项历史history_uint (无正负)的项趋势trends_uint 存储信息类型为字(无正负)的项趋势trends 表结构?

    31520

    让web开发部署提速 8 倍的一款IDEA插件

    作为一个 Java 程序员,我们大多会在 Intellij IDEA 中基于 SpringBoot 来开发 WEB 应用,所以本文中的测评将会基于以下几个架构来构建: 开发环境:IDEA项目组织方式: Deploy to ECS:这里的 ECS 指的阿里云的 ECS,如果你的服务部署在阿里云 ECS 上,可以选择使用这个功能,获得比 Deploy to Host 更加丰富的功能。 在账号设置完毕后,Cloud Toolkit 看起来是通过内置的 API 直接关联到了我的 ECS 实例,在选择部署时,可以直接根 region 选择实例列表中的机器进行部署。? 线上遇到某个用户的处理有问题,但线上同样无法 debug,线下无法重现!是否有一个全局视角来查看系统的运行状况?有什么办法可以到 JVM 的实时运行状态? 用户可以自行对应的方法,把 * 替换为想要的方式即可。(更多的指令可以参考 Arthas 文档链接:https:alibaba.github.ioarthas)

    1.2K10

    让web开发部署提速 8 倍的一款 IDEA 插件,我参与贡献了

    原文:http:suo.im4on4JE 来源于云栖社区>中间件小哥作为一个 Java 程序员,我们大多会在 Intellij IDEA 中基于 SpringBoot 来开发 WEB 应用,所以本文中的测评将会基于以下几个架构来构建 Deploy to ECS:这里的 ECS 指的阿里云的 ECS,如果你的服务部署在阿里云 ECS 上,可以选择使用这个功能,获得比 Deploy to Host 更加丰富的功能。 在账号设置完毕后,Cloud Toolkit 看起来是通过内置的 API 直接关联到了我的 ECS 实例,在选择部署时,可以直接根 region 选择实例列表中的机器进行部署。? 线上遇到某个用户的处理有问题,但线上同样无法 debug,线下无法重现!是否有一个全局视角来查看系统的运行状况?有什么办法可以到 JVM 的实时运行状态? 用户可以自行对应的方法,把 * 替换为想要的方式即可。(更多的指令可以参考 Arthas 文档链接:https:alibaba.github.ioarthas)

    25220

    四件简单的事情,帮助改善部署过程

    显然,是至关重要的,但是我们的视方式是将其用于自动化部署的关键。在我工作过的所有地方,我们都对应用程序和库进行了某种形式的,但并非所有人都进行了应用程序运行状况检查。 该connnection_status告诉我们,应用程序是否可以连接库或下游服务。如果不能,那么我们可以查看这是网络问题,密码问题还是下游服务离线的问题? 我发现易于实现且非常有帮助的一件事是记录更改事件并将该事件添加到您的系统。使用部署工具轻松完成此操作,以使用部署事件更新系统。这是一个示例,其中我们最近部署了应用程序,响应时间立即增加。 Pod:尽量减少影响Pods的概念有许多不同的迭代,从中心设计,VMware Pods到Kubernetes Pods。Pod有多种使用或设计的方式。 过去,我在ECS中运行过两个版本的应用程序,都指向同一个库。您的应用程序和库需要向前和向后兼容。兼容性的关键是您的库架构更改。您需要确保将列删除延迟到两个版本都不需要它为止。

    9121

    当SRS遇到K8s:如何构建海量推流源站?

    海量推流:单源站可以支持1000到3000路流,高码率的流支持的路更少,有DVR和HLS时支持的路更少,源站集群有多个源站同时接收推流,可以支持10k~100k推流,参考规格。 异常退出由看门狗重新拉起,非K8s需要手动安装, K8s自动管理和拉起服务更换ECS手动自动ECS更换时,非K8s需要手动申请,修改SLB,安装服务,K8s自动迁移服务,更新SLB配置听和保活等配置文件 只需要修改Replicas目即可(也可自动扩容)发现手动自动Origin变更IP时,ECS需要手动修改配置,K8s在迁移源站Pod时会保持,或自动更新SLB手动自动新增Origin时,ECS需要手动安装和更新配置 PV(Persistent Volume)持久化卷,可购买NAS例如:驱动类型(PV driver):alicloudnas挂载点(PV server),可在制台创建、查看和复制:1abb5492f7 cn-beijing.nas.aliyuncs.comNFS版本(PV vers):3在NAS基础上可以创建PV,以及PVC:pv-nas,从NAS存储创建的PV,支持多写和多读,Pod不使用存储后会回收,也就是删除这些

    9820

    AWS 容器服务的安全实践

    AWS负责云本身的安全,包括保护所有运行AWS云服务的基础设施,包括区域,可用区,边缘站点,计算存储网络,库等等。客户负责云内部的安全。 客户的责任由客户使用的AWS服务确定,通常来讲,客户会负责操作系统的安全,网络和防火墙的配置,身份和访问管理,应用,平台和客户的安全。 CloudTrail 是一项支持对AWS 账户进行管、合规性检查、操作审核和风险审核的服务。借助 CloudTrail,您可以记录日志、持续并保留与整个 AWS 基础设施中的操作相关的账户活动。 网络代理包含在每一个微服务之中,主要处理微服务之间的通信,,以及一些安全相关的工作。我们可以使用服务网格增强安全性。 第五,我们看一下容器中客户的安全。AWS同时具有Parameter Store和Secrets Manager来存储您的机密。

    15120

    Python重启深信服设备

    一、背景 在生产环境中,有客户架构为阿里云线上环境及线下IDC需要内网互通,互联采用阿里云使用第三方深信服云产品与线下IDC侧Cisco防火墙ipsec打通实现,主要用于定时阿里云文件及备份至IDC ,在生产应用中无故隧道会不定时中断,联系深信服及思科售后排查均没有结果,但是进行手动的重启阿里云上深信服设备隧道立即恢复,在两边网络工程师排查无果后,想到去编写脚本,如果隧道终端去利用python重启深信服设备 ,从而恢复隧道,传输延迟timeout及使用断点续传,当网络层面异常无法解决时,换另一种思路来解决问题。 二、技术要点 2.1 编写隧道脚本由于线上阿里云侧为公有云,且为配置EIP及NAT网关,ecs均采用前端公网SLB负责业务请求接入,其内部无法出公网,隧道脚本想告警出来发送至微信及后续的去操作深信服需要公网连通 pdcping.lock` if ;then echo 1 > ${dir}pdcping.lock else continue fi fidone 3.1.2 检查脚本功能 为防止隧道检测脚本异常,另外编写测脚本的脚本配合定时任务来定时

    1K60

    DELLEMC的 PowerScale和ECS在CDP私有云基础版的认证迈出了下一步

    自从Cloudera平台(CDP)诞生以来,Dell EMC的PowerScale和ECS一直是高度要求的Cloudera进行认证的解决方案。 对于现有的CDH和HDP客户,下表突出显示了新的CDP PvC Base平台的功能:CDH客户的新功能Ranger 2.0•动态行过滤和动态列掩码•基于属性的访问制•SparkSQL细粒度的访问制• Sentry到Ranger的迁移工具Atlas 2.0•元、血缘和管链,高级发现和业务词汇表•Navigator到Atlas的迁移,提高了性能和可伸缩性Streaming•支持与HDFS,AWS 集成以获取快速并为策略提供Ranger•用于大处理和分析的单一系统,因此客户可以避免仅用于分析的昂贵的建模和ETLHue•内置SQL编辑器,可自动完成智能查询•共享查询,图表结果并下载任何库 •轻松搜索,浏览,导入集或作业Kudu•更好的性能,可快速更改更新

    16220

    使用云创建一个云钉钉机器人【教程】

    需要使用到的产品学习使用 阿里云·云教程首先,我们进入到 云 的 管理制台 ,就会看到所有已开通支持云的云服务的概览。 进入 Dashboard 默认是一个 ECS 服务的大盘,ECS 对云的集成度很高,基本上就开一个开箱机用的状态。当然我们也可以创建一个自己的大盘,点击右上角的 创建大盘 即可。 然后我们选择需要的 图表类型、产品、项和资源 即可,基本上分分钟就可以制作出一个图表信息丰富的云服务大盘来了。 具体单项产品的详细可以在 云服务 列表下查看到:使用云网站可用性进入 站点管理 选择 创建点像 FTP、SMTP、DNS 等可能需要一些更高级的设置,点击高级设置,还可以进行账号密码等内容的交互设置 点击列表进入 报警规则—— 设置报警规则设置报警的,比如说当丢包率达到 50% 的时候进行报警选择需要的类型,包括有 HTTPHTTPS、ICMP、TCP、UDP、POP3、SMTP、DNS

    1.6K80

    相关产品

    • 云监控

      云监控

      云监控(CM)可收集并通过图表展示腾讯云云产品自助上报的各项监控指标和用户自定义配置上报的监控指标,以及针对指标设置告警,让您实时、精准掌控业务和各个云产品健康状况。

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注云+社区

      领取腾讯云代金券