共计 2567 个字符,预计需要花费 7 分钟才能阅读完成。
一、概念
并发连接数
客户端向服务器发起请求,并建立了 TCP 连接。每秒钟服务器链接的总 TCP 数量,就是并发连接数。
请求数
请求数指的是客户端在建立完连接后,向 http 服务发出 GET/POST/HEAD 数据包。
拓展:服务器返回了请求结果后有两种情况:
http 数据包头包含 Close 字样,关闭本次 TCP 连接;
http 数据包头包含 Keep-Alive 字样,本次连接不关闭,可继续通过该连接继续向 http 服务发 送请求,用于减少 TCP 并发连接数。
PV(page view)
访问量, 即页面浏览量或者点击量, 用户每次对网站的访问均被记录 1 次。用户对同一页面的多次访问,访问量值累计
UV(unique visitor)
独立访客量。将每个独立设备(以 cookie 为依据)视为一位访客,一天之内(00:00-24:00)的访客数量。一天之内相同 cookie 的访问只被计算 1 次。
独立 IP
00:00-24:00 内相同 IP 地址只被计算一次
二、Nginx 配置
版本
nginx version: nginx/1.10.2
日志配置项
access_log /var/log/access.log access;
日志格式
log_format access ‘$remote_addr – $remote_user [$time_local] “$request” $request_body ‘
‘$upstream_addr $upstream_response_time $request_time ‘
‘$status $body_bytes_sent “$http_referer” ‘
‘”$http_user_agent” $http_x_forwarded_for ‘ ;
三、常用日志分析命令
1、总请求数
wc -l access.log |awk ‘{print $1}’
2、独立 IP 数
awk ‘{print $1}’ access.log|sort |uniq |wc -l
3、每秒客户端请求数 TOP5
awk -F'[[]’ ‘{print $5}’ access.log|sort|uniq -c|sort -rn|head -5
4、访问最频繁 IP Top5
awk ‘{print $1}’ access.log|sort |uniq -c | sort -rn |head -5
5、访问最频繁的 URL TOP5
awk ‘{print $7}’ access.log|sort |uniq -c | sort -rn |head -5
6、响应大于 10 秒的 URL TOP5
awk ‘{if ($12 > 10){print $7}}’ access.log|sort|uniq -c|sort -rn |head -5
7、HTTP 状态码 (非 200) 统计 Top5
awk ‘{if ($13 != 200){print $13}}’ access.log|sort|uniq -c|sort -rn|head -5
8、分析请求数大于 50000 的源 IP 的行为
awk ‘{print $1}’ access.log|sort |uniq -c |sort -rn|awk ‘{if ($1 > 50000){print $2}}’ > tmp.txt
for i in $(cat tmp.txt)
do
echo $i >> analysis.txt
echo “ 访问行为统计 ” >> analysis.txt
grep $i access.log|awk ‘{print $6}’ |sort |uniq -c | sort -rn |head -5 >> analysis.txt
echo “ 访问接口统计 ” >> analysis.txt
grep $i access.log|awk ‘{print $7}’ |sort |uniq -c | sort -rn |head -5 >> analysis.txt
echo -e “\n” >> /root/analysis/$Ydate.txt
done
注:如果源 IP 来自代理服务器,应将第一条命令过滤地址改为 $http_x_forwarded_for 地址
awk ‘{print $NF}’ access.log|sort |uniq -c |sort -rn|awk ‘{if ($1 > 50000){print $2}}’ > tmp.txt
四、延伸
Nginx 日志按日切割后可使用上述命令得出每日网站流量分析概况,然后可以写一个 Python 脚本读取后发送。也可以将数据导入 MySQL 然后使用 Python 绘制曲线。当然使用日志分析系统,如 ELK,效果更佳。
更多 Nginx 相关教程见以下内容:
CentOS 6.2 实战部署 Nginx+MySQL+PHP http://www.linuxidc.com/Linux/2013-09/90020.htm
搭建基于 Linux6.3+Nginx1.2+PHP5+MySQL5.5 的 Web 服务器全过程 http://www.linuxidc.com/Linux/2013-09/89692.htm
CentOS 6.3 下 Nginx 性能调优 http://www.linuxidc.com/Linux/2013-09/89656.htm
CentOS 6.3 下配置 Nginx 加载 ngx_pagespeed 模块 http://www.linuxidc.com/Linux/2013-09/89657.htm
Ubuntu 16.04 LTS 上安装 Nginx、MariaDB 和 HHVM 运行 WordPress http://www.linuxidc.com/Linux/2016-10/136435.htm
Nginx 安装配置使用详细笔记 http://www.linuxidc.com/Linux/2014-07/104499.htm
Linux(RHEL7.0)下安装 Nginx-1.10.2 http://www.linuxidc.com/Linux/2016-10/136484.htm
Nginx 日志过滤 使用 ngx_log_if 不记录特定日志 http://www.linuxidc.com/Linux/2014-07/104686.htm
Nginx 的详细介绍:请点这里
Nginx 的下载地址:请点这里
本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-01/139044.htm