温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
大家好,我要给大家快速概述一下auto OS, 以及它如何有助于提升elastic search上的性能,进行故障排查并解决部署方面的问题。在这里我们有auto OS部署视图,在这个视图中,你可以看到该系统随时间推移检测到的各种事件,比如搜索缓慢事件和索引失败事件,还有其他一些有意思的事件,比如跨水未现事件等等。让我们来查看一个具体的事件。假设有人报告说平台运行缓慢,搜索性能迟缓。作为运维人员,我们可以利用out OS看到已经检测到在同一时段发生的长时间运行的搜索任务。例如,我们看到由10个任务。
01:00
运行了超过1分钟,其中耗时最长的一个任务运行了3分钟。每个任务都提供了详细信息,包括涉及的输入内容以及延迟增加的可能原因。在这种情况中,查询已经运行了一周,并且聚合技术明显很高。我们可以深入研究这个具体的查询,以了解如何对其进行优化。这里还有额外的跟踪信息,比如跟踪ID和日期,这些有助于追踪发起查询的应用程序和用户。而且在这里我们特别还有一个与之相关的T8内仪表盘。该任务包含更多事件具体细节,并且在末尾还提供了一些推荐的命令,比如取消查询,这可以作为一种快速解决问题的办法。现在让我们来看另一个有意思的场景。
02:00
当数据摄入缓慢且实时数据没有出现在集群中时,各种事件可以帮助确定原因。例如,系统会检测到队列中的索引数量很高,在这里我们看到队列大小攀升到了2000以上。Out OFS会突出显示导致这个问题的具体节点和索引。在这种情况中,我们会被引导至索引分片式,在那里我们可以查看具有高队列数量的具体索引和节点。我们可以看到这个特定的索引在该节点上承担了大部分的所有负债。缩小视图以查看更广泛的层级时,我们注意到索引分配情况是主索引分配到了食物。
03:00
5个节点副本索引也分配到了15个节点,增加额外的节点能够更有效的分担这一负载。回到这个事件,Autos建议对索引进行滚动更新,并添加更多主分片,这样在这种情况下可以改善拥堵状况。还有其他一些界面,比如向下钻取图和索引视图。在这些界面中,你可以根据索引速度、搜索速率和延迟手动对索引进行排序,并随时间追踪相关统计数据。我们的概述就到此为止了。还有很多其他事件我们尚未涉及,但希望你们喜欢我们所讲到的这些内容。
我来说两句