夜莺V4监控安装教程

2021年6月26日 没有评论

一、演进背景

v3版本融入了很多运维平台的功能,组件变多,部署麻烦,不同的组件相互之间有调用关系,在做分布式部署的时候需要了解整体架构才能正确修改配置文件,对用户提出了较高的要求。很多issue和群里的讨论,都反映出了这个复杂性问题。

我们希望降低这个复杂度,所以,把众多服务端模块做了合并。这样原来组件之间的调用都变成了进程内部的方法调用,可靠性性能都会提升。

二、新的架构

模块合并之后,把时序存储抽离,总共只剩3个组件:server、prober、agentd。

服务端就是部署server模块,如果要集群部署,就搞2个机器,每个机器分别部署server模块即可。每个server会使用本机的redis,[……]

继续阅读

分类: Linux 标签:

I/O漫谈–以 fio 命令为例

2020年7月26日 没有评论

fio 命令可以方便的对Linux系统进行硬盘I/O性能方面的测试。

软件Github地址:https://github.com/axboe/fio/

1、安装及环境配置

测试环境:centos6.9(x64)

硬件配置(其中vdb和vdc是SSD):

[root@x ~]# grep -E "model name|physical id" /proc/cpuinfo |sort|uniq
model name	: Intel(R) Xeon(R) CPU&nbs[......]

继续阅读

分类: Linux 标签:

tcpdump 抓包总结

2020年5月8日 没有评论

tcpdump dump traffic on a network)。主要来对协议,主机,端口结合and&&)、or||)、not!)逻辑进行网络层数据包的获取及分析。

tcpdump命令可使用的参数很多:

-A:以ASCII编码打印每个报文(不包括链路层的头),这对分析网页来说很方便;
-a:将网络地址和广播地址转变成名字;
-c:在收到指定的包的数目后,tcpdump就会停止;
-C:该选项使得tcpdump 在把原始数据包直接保存到文件中之前, 检查此文件大小是否超过file-size. 如果超过了, 将关闭此文件,另创一个文件继续用于原始数据包的记录. 新创建的[......]

继续阅读

分类: Linux 标签:

记一次服务器性能问题排查

2020年5月3日 没有评论

前几天发现有一个集群在流量高峰时期的访问失败率比较高。 通过小米监控发现有一台服务器在当天流量高峰时候网卡有net.if.in.dropped现象。并且这台机器的CPU软中断一直比其他服务器高,尤其是有问题的那个时间段:


通过其它的监控指标发现当时集群的网卡进出口流量一致,磁盘使用也一致,集群的负载是均衡的,唯一有差别的就是上面的两个指标。当时的场景没有抓到,事后我们主要用 vmstat,iostat,top 这三个命令来进行一下分析总结。vmstat命令可以动态的展示系统当前的内存使用,I/O吞吐,CPU使用情况。直接执行vmstat命令展示的数据说明如下:

Procs
  &nbsp[......]

继续阅读

分类: Linux 标签: