首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何每天管理20个或更多Linux服务器?

如何每天管理20个或更多Linux服务器?
EN

Server Fault用户
提问于 2009-11-20 04:21:08
回答 4查看 925关注 0票数 5

我正在研究集中管理20个Linux服务器和100个Linux工作站的最熟练的方法。

我不知道是否有一些行政和监测套房,以实现日常行政工作和故障排除从一个单一的站。

EN

回答 4

Server Fault用户

发布于 2009-11-20 14:12:33

我有一个有40个工作站和大约15个计算节点的站点。

我管理工作站的方法是:

  • 迫使工程师将所有数据存储在NFS网络上,而不是本地存储。
  • 不让任何工程师以任何理由在任何工作站上扎根
  • 拥有所有系统syslog到中央syslog-ng主机,日志解析定期进行(通常每天进行,但有时每小时进行一次)。
  • 用nagios监视上/下
  • 有一个可重复的启动环境-经验法则是,如果一个问题不能在30分钟内修复,那么机器就会重新启动(实际上,我们启动的速度要快得多,因为在这个设置中,我们很少有30分钟的故障排除,我们可以做),如果启动失败,我们就开始交换硬件。

我用同样的方式管理计算机农场,除了:

  • 有一个本地/scratch目录,任何人都可以写任何东西--但是该目录的内容不能保证。
  • 性能/使用计数器由中心主机通过munin完成。
  • 网络活动是通过使用activity来监视场节点连接到的交换机端口来完成的。

它不是完美的,但它保持了这个网站的运行。

(哦,我应该说这个网站没有任何全职IT人员,它是PT和点播的。上面的监控系统通常可以让你知道有一台计算机处于困境。)

票数 8
EN

Server Fault用户

发布于 2009-11-20 04:52:21

关于自动化,您有几种选择,包括

  • cfengine
  • 木偶 (目前使用的是什么)
  • 大厨

在监控方面,我建议使用伊辛加纳古斯,它们基本上是相同的。

希望这能有所帮助。真正要做的就是规划出您想要使用自动化和监控的内容,然后根据您的需求选择最佳的解决方案。每件事都有它自己的优点和缺点,所以要仔细计划和选择你想要的。

票数 4
EN

Server Fault用户

发布于 2009-11-20 05:26:24

我从使用大厨来管理服务器配置中获得了最大的价值。莫尼特收藏%d伊辛加帮我监视他们。

票数 4
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/86567

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档