1、问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端、本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器硬件配置一样,部署的软件都一样,却单单这一台负载有问题,初步猜测可能硬件有问题了。 同时,我们还需要把负载有异常的罪魁祸首揪出来,到时候从软件、硬件层面分别寻找解决方案。 2、排查: 从 top 中可以看到load average 偏高,%wa 很高,%us 偏低: 从上图我们大致可以推断 IO 遇到了瓶颈,下面我们可以再用相关的 IO 诊断
2014-12-16 15:43 xrzs
分享到微信
打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。