首页
学习
活动
专区
工具
TVP
发布

Ceilometer和Monasca 能帮OpenStack实现智能运维

打造开源云计算中国第一互动社区

内容专注于Linux、Kubernetes、OpenStack、容器、Ceph、Cloud Foundry......

导读

管理员们继续寻求更有效的方式来解决OpenStack的故障排除和调试,最近的平台升级以及第三方工具,提供了一些帮助。

正文

对于开发者来说,调试复杂的应用程序一直是件苦差事,而开源代码尤其如此—— OpenStack 似乎是这个挑战和痛苦的缩影。

一些 OpenStack 用户仍然很难调试或解决简单的错误。部分原因在于 OpenStack 故障排除的唯一真实接口是一组日志文件 —— 每个主要模块都有一个或多个,这些日志文件包含简洁的错误消息。正如一位用户在2017年 OpenStack 用户调查中写到的,管理员仍然“ 需要查阅一大堆日志和源代码”来确定问题原因。

最终,管理员想要的是更多关于问题的信息和更少的数据。短期来看,OpenStack 基金会正在推进的一步是让管理员将关键问题视为系统监视工具中的触发事件,并能够深入查看相关日志数据。

长远来看,注入AI,并且包含更多的图形界面(可以标记问题,提供可能的原因并提供纠正措施),会更好。

这似乎是一个遥远的希望(至少在现在),但围绕 OpenStack 故障排除和调试的工具已经有了一些进步。

Ceilometer和Monasca

Ceilometer 和 Monasca 是两个主要的OpenStack项目,已经解决了一部分数据收集问题。

在这两个项目中,Ceilometer 更具备优势。它将来自所有 OpenStack 服务的日志数据转换为 Gnocchi 数据库,并使其可以索引。这使得管理员可以将这些数据用于计费和调试。

Monasca 是一个多租户监控即服务工具,可以帮助IT团队分析日志数据并设置警报和通知。最终,它应该在 Gnocchi 数据库中提供挖掘功能来加速故障分析。

还有两个子项目着重于扩展 Ceilometer——Aodh 为Ceilometer 生成的数据创建策略驱动的警报,另一个子项目 Panko 在某个时间点捕获 OpenStack 状态数据。

第三方工具帮助OpenStack故障排除

虽然上面提到的 OpenStack 项目是朝着正确的方向迈出的一步,但它们还不足以显著简化现在的调试。目前,团队可能需要第三方附加组件来完全分析 OpenStack 数据并响应任何问题。

Datadog 就是这样一个工具。它使团队能够跟踪、可视化和关联来自 OpenStack 及其应用程序的指标。这有助于管理员发现并解决他们云平台上的任何异常情况。开源分析和可视化工具 Grafana 让管理员可以查看 Ceilometer 时间序列数据中的趋势,而 Tata Communications 的云检查器框架将元数据添加到云实例以加速日志搜索。供应商还有一个长期的计划来整合AI工具,以提供自动发现和纠正措施。

使用AI来监视、调试和采取纠正措施仍处于初期阶段。但是压力不断增加——必须在 OpenStack 中增加自动化。容器将使 OpenStack 虚拟实例数量增加四倍以上,而微服务和软件定义的数据中心将进一步扩大管理员需要跟踪的IT资源数量,以及加快解决性能问题所需的速度。

不久后,我们可能会看到可以指导基础架构调优和调试的专家聊天机器人,类似的智能调试即服务工具也会越来越多地进入市场。

最终,这些 AI 方法将是管理员对 OpenStack 故障排除以及更通用的响应式监控的最佳选择。预计2018年也会有更多的供应商进入这个领域。

内容覆盖主流开源领域

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180122B02V8X00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券