首页
学习
活动
专区
圈层
工具
发布

点评cat高可用实时监控系统

CAT总体介绍 CAT(Central Application Tracking)是由吴其敏(前大众点评首席架构师,现携程架构负责人)主导设计基于Java开发打造的实时应用监控平台,为大众点评网提供了全面的监控服务和决策支持...CAT作为大众点评网基础监控组件,它已经在中间件框架(MVC框架,RPC框架,数据库框架,缓存框架等)中得到广泛应用,为点评各业务线提供系统的性能指标、健康状况、基础告警等。 CAT解决什么问题?...2000+ 业务应用(包括部分.net以及Job) 7000+ 应用服务器 50TB 消息,~450亿消息(每天) 项目地址:https://github.com/dianping/cat 大众点评网监控系统架构剖析...点评这些也在用,主要是zabbix,他和CAT互相补充。 之前小米开源的系统应该也是基于指标的画图以及告警,和CAT应该是两类不同的系统。...App监控点评做了三个部分: 返回码系统(多维度下,API、城市、运营商、网络、APP版本等) 实时Crash日志(版本、平台、模块等维度) 测速系统(打开一个APP某个页面的分段速度测试,一个页面可能包括广告

86040
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    饿了么监控系统 EMonitor 与美团点评 CAT 的对比

    背景介绍 ---- 饿了么监控系统 EMonitor :是一款服务于饿了么所有技术部门的一站式监控系统,覆盖了系统监控、容器监控、网络监控、中间件监控、业务监控、接入层监控以及前端监控的数据存储与查询。...CAT:是基于 Java 开发的实时应用监控平台,为美团点评提供了全面的实时监控告警服务。 本文通过对比分析下两者所做的事情为契机讨论监控系统或许该有的面貌,以及浅谈下监控系统发展的各个阶段。...平台打通整合阶段 上一阶段存在的问题:系统监控、中间件和业务监控、部分业务监控、链路监控与指标监控都各搞一套数据收集、预处理、存储、查询、展现、告警流程,各个系统处理数据格式、使用方式不统一。...告警方式:可以统一的针对各个层面的监控数据做统一化的告警排障过程:只需要在一个监控系统中就可以查看到所有的监控曲线和链路信息。...目前我们 EMonitor 已完成这个阶段,将公司之前存在已久的 3 套独立的监控系统统一整合成现如今的一套监控系统。

    1.9K10

    高可用性系统在大众点评的实践与经验

    原文出处: 美团点评技术博客 所谓高可用性指的是系统如何保证比较高的服务可用率,在出现故障时如何应对,包括及时发现、故障转移、尽快从故障中恢复等等。...本文主要以点评的交易 系统的演进为主来描述如何做到高可用,并结合了一些自己的经验。需要强调的是,高可用性只是一个结果,应该更多地关注迭代过程,关注业务发展。...频率要低:减少出故障的次数 设计:根据业务变化不断进行迭代 以点评交易系统的演进过程为例。 幼儿时期:2012年前 使命:满足业务要求,快速上线。...系统可能会演进为下图这样: ? 上面点评交易系统的发展几个阶段,只以业务系统的演进为例。...点评的监控系统CAT能很好的提供这些指标变化,我们系统在这些基础上也做了一些更实时的能力,比 如订单系统QPS就是秒级的监控曲线。 ? 有效的恢复机制 比如运维的四板斧:回滚、重启、扩容、下服务器。

    1.6K70

    专家点评 | 【Google 年度顶级论文】机器学习系统,隐藏多少技术债?

    杨静 ༅ 新智元: @wei 你可以写一篇点评! 我: @杨静 ༅ 新智元 这里这么多 ML 大牛,哪里轮得到我这个语言学家点评啊。我算是雾里看花,因为做的都是工程系统,也有强烈共鸣罢了。...债务的结果就是系统报废。历史上见过不少开发了很多年的系统,最后死掉了,封存了,无人问津了。当然,死系统的原先的开发者往往带着教训和经验,在下一轮重开炉灶的系统中,轻装上阵,做得更好。...如果一切都保留到语用层面最后定夺,很怀疑任何系统设计者会受得了那样的千头万绪。反正我们在实践中是不行的。...最后做出了一个畸形的系统出来,给 POS 打补丁的模块是整个系统最大的模块,比所有其他模块(包括前处理、Brill POS、NE、chunking、SVO、Events)加起来还大。...反正,NLP 终归是长线项目,时间压力只是要求系统先转起来,iteratively 和 incrementally 地擦屁股和维护协调是系统转起来以后的必由之路。

    88060

    破解点评网字体反爬,深入挖掘系统背后的原理

    演示环境 - 操作系统:windows10 - python版本:python 3.7 - 代码编辑器:pycharm 2018.2 - 使用模块:requests,json,re,fontTools...可以看到,评论中的某些文字点评网做了特殊处理,这就是所谓的字体反爬。 抓取数据 前面的步骤,我们已经知道点评网对评论内容做了处理,至于是如何处理,这里我们先不管,还是先把数据拿到再说。...猜想这就是点评网自己定义的字体。居然自定义了字体,那么网页中肯定需要加载字体文件,所以果断打开network对字体文件进行抓包。...我们可以看到,点评网有许多个自定义的字体,这里只需要找自己想要的字体文件即可,即找字体文件的url。...不得不服点评网,反爬虫做的真是厉害。。。 我就知道你在看

    1.4K20

    嫁了点评,剩了豆瓣

    大众点评终于有归属了。说到大众点评,我总会想起另一个“慢公司”:豆瓣,杨勃花1个月时间开发的社区。 它已经成为一个兴趣社交王国。...这就是慢公司,如豆瓣、大众点评等。 “大众点评”已在这两年一改往日作风,加快扩张步伐。2010年团购火热时大众点评推出团购平台,市场份额仅次于美团。...它有文化点评数据库。豆瓣的初心是连接“人”与“物”,帮助人们发现图书、音乐、电影和生活的方方面面。歌曲、图书和电影,歌手、影人、作家,以及基于这些条目的评价和评论数据。...这一点与大众点评有一些相似之处,但大众点评的对象是线下商铺,是“实体”。 物体数据库正在形成。...标签是组织不同类型的海量信息的最有效的方式,基于标签可以索引出感兴趣的内容,系统可以根据标签进行推荐。标签搜索是搜索引擎的细分。 有了这些数据可以干嘛呢?

    80650

    美团点评智能支付核心交易系统的可用性实践

    我们负责的系统是美团点评智能支付的核心链路,承担着智能支付100%的流量,内部习惯称为核心交易。...发生频率要低之别人死我们不死 1.1 消除依赖、弱化依赖和控制依赖 用STAR法则举一个场景: 情境(situation) 我们要设计一个系统A,完成:使用我们美团点评的POS机,通过系统A连接银行进行付款...关闭测试模式则超过限流阈值系统做异常抛出处理。限流策略可以随时关闭。 可以使用Netflix的Hystrix或者美团点评自己研发的Rhino来做特殊的针对性限流。 4....美团点评内部可以使用的用于发现、定位、处理的系统和平台非常多,但是如果一个个打开链接或者登陆系统,势必影响解决速度。所以我们要做集成,让问题一站式解决。...和Hystrix对比: 内部通过CAT(美团点评开源的监控系统,参见之前的博客“深度剖析开源分布式监控CAT”)进行了一系列埋点,方便进行服务异常报警。

    2.8K30

    腾讯投资点评,论胜负太早

    腾讯终于还是拿下了大众点评。 一、AQ军备竞赛持续升级 2014年,阿里与腾讯基于移动支付的战争不断升级。但这不是腾讯入股大众点评的直接原因。09、10年腾讯便有纳入大众点评的想法。...大众点评的业务约等于阿里投资的美团+丁丁+口碑。但点评的团购与美团有差距,阿里还有聚划算。大众点评的优惠和点评则是老大,腾讯还有微生活。...腾讯选择投资大众点评,意味着大众点评此后将成为其本地生活服务十分重要的战略业务。而此前的种种布局例如微生活、高朋(现在的网罗天下,微信电影票提供商),或将让位于大众点评。像搜搜一样下嫁也不是没有可能。...如果真做成了,团购、点评、优惠、会员、点餐,全在上面,高德地图和支付宝钱包装进去,比什么都能闭环。...大众点评剥离掉团购业务后,本质是生活信息服务。这些信息百度也有。用百度App搜索“雕爷牛腩”,结果页面地图占据很大篇幅,信息则有评级、点评、路线等。

    1.1K80

    美团点评智能支付核心交易系统的可用性实践

    本文是我原创,原文首发于美团点评技术博客,原文地址是:https://mp.weixin.qq.com/s/pxNRzWs3sZmbr-K18FvnrA 背景 每个系统都有它最核心的指标。...我们负责的系统是美团点评智能支付的核心链路,承担着智能支付100%的流量,内部习惯称为核心交易。...发生频率要低之别人死我们不死 1.1 消除依赖、弱化依赖和控制依赖 用STAR法则举一个场景: 情境(situation) 我们要设计一个系统A,完成:使用我们美团点评的POS机,通过系统A连接银行进行付款...美团点评内部可以使用的用于发现、定位、处理的系统和平台非常多,但是如果一个个打开链接或者登陆系统,势必影响解决速度。所以我们要做集成,让问题一站式解决。...和Hystrix对比: 内部通过CAT(美团点评开源的监控系统,参见之前的博客“深度剖析开源分布式监控CAT”)进行了一系列埋点,方便进行服务异常报警。

    96110
    领券