阿萍的博客

“Linux 性能优化”

套路篇:监控的思路

1 系统监控系统监控需要涵盖系统的整体资源使用情况,比如 CPU、内存、磁盘、文件系统和网络等各种系统资源。1.1 USE 法USE 法把系统资源的性能指标简化为了三个类别,使用率、饱和度和错误...

案例篇:动态追踪怎么用?

使用动态追踪,可以在不修改代码、不重启服务的情况下,动态了解应用程序或者内核的行为,这对排查线上问题、特别是不容易重现的问题尤其有效。Linux 提供了一系列的动态追踪机制,比如 ftrace、...

案例篇:服务吞吐量下降很厉害,怎么分析?

1 现象查看服务性能:# 默认测试时间为 10s,请求超时 2s $ wrk --latency -c 1000 http://192.168.0.30 Running 10s test @ h...

案例篇:内核线程 CPU 利用率太高,我该怎么办?

在排查网络问题时,经常会碰到的一个问题是,内核的 CPU 利用率较高。比如高并发场景下,内核线程 ksoftrqd 的 CPU 使用率就会比较高,是网络收发的软中断导致的。接下来看下如何分析内核...

案例篇:为什么应用容器化后,启动慢了很多?

1 现象一启动容器:# -m 表示设置内存为512MB $ docker run --name tomcat --cpus 0.1 -m 512M -p 8080:8080 -itd feisk...

服务器总是时不时丢包,我该怎么办?

1 现象# -c 表示发送 10 个请求,-S 表示使用 TCP SYN,-p 指定端口为 80 $ hping3 -c 10 -S -p 80 192.168.0.30 HPING 192.1...

套路篇:网络性能优化的几个思路

1 确定优化目标具体到不同的应用中,每个指标的优化标准可能不同。对于 NAT 网关,直接影响到整个数据中心的网络出入性能,需要达到或接近线性转发,PPS 是主要的性能指标。对于数据库、缓存等,需...

案例篇:网络请求延迟变大了,我该怎么办?

1 现象$ wrk --latency -c 100 -t 2 --timeout 2 http://192.168.0.30:8080/ Running 10s test @ http://1...

案例篇:如何优化 NAT 性能?

Content: # 1 NAT 原理NAT 可以重新 IP 数据包的源 IP 或目的 IP,用来解决公网中 IP 地址短缺问题。原理是内网中的多个机器共用一个公网 IP 来访问外网。SNAT ...

案例篇:怎么缓解 DDoS 攻击带来的性能下降问题?

1 现象# -w 表示只输出 HTTP 状态码及总时间, # -o表 示将响应重定向到 /dev/null # --connect-timeout 表示连接超时时间 $ curl -w 'Ht...