Nginx基于请求头的分发

193次阅读

共计 5436 个字符，预计需要花费 14 分钟才能阅读完成。

前面的分发方式都是基于一个集群分发的，nginx 是一个基于 7 层的分发也就是可以实现基于主机头的分发，这种分发一般都是用于多集群环境中。

客户端浏览器开发者工具 network 工具下，获取请求的请求头信息如下所示：

 Request URL: http://192.168.0.40	# 请求的 URL
Request method:GET	# 请求的方法，GET 是获取数据
Remote address:192.168.0.40:80# 远程主机的地址
Status code: 200 OK	# 请求代码，200 表示正常，如果页面无法打开会显示 404，403 等
Version: HTTP/1.1#HTTP 协议的版本
 
 
Response headers (235 B)	# 响应头	
Accept-Ranges：bytes# 接受范围，如果出现此字段表示，这是一个续传的下载（断点续传），bytes 表示服务器可接受范围请求的单位是 bytes，none 表示不支持
Connection：keep-alive # 是否支持长连接，从 HTTP1.1 开始默认
Content-Length：5	# 返回的数据长度，单位为字节
Content-Type：text/html# 页面类型，文本、图片、视频、音频
Date：Fri, 21 Feb 2020 01:37:17 GMT# 返回的时间
ETag："5e4e2e62-5"# 验证标签，用来帮助控制缓存验证，当浏览器请求服务器的某项资源 (A) 时, 服务器根据 A 算出一个哈希值，并通过 ETag 返回给浏览器，浏览器把对应的哈希值和 A 同时缓存在本地，当下次再次向服务器请求 A 时，会把这个哈希值发送给服务器，服务器再次计算 A 的哈希值并和刚刚接收到的哈希值做比较，如果发现 A 发生了变化就把 A 返回给浏览器(200)，如果发现 A 没有变化就给浏览器返回一个 304 未修改。这样通过控制浏览器端的缓存，可以节省服务器的带宽，因为服务器不需要每次都把全量数据返回给客户端
Last-Modified：Thu, 20 Feb 2020 06:59:46 GMT# 服务器认定的资源做出修改的日期及时间。它通常被用作判断接收到的或者存储的资源是否一致。由于精确度比 ETag 要低，所以这是一个备用机制。
Server：nginx/1.15.12	# 服务器的软件类型和版本
 
 
Request headers (355 B)	# 请求头
Accept：text/html,application/xhtml+xm… # 接受的数据类型
Accept-Encoding：gzip, deflate	# 是否支持压缩，及类型
Accept-Language：en-US,en;q=0.5	# 语言环境
Cache-Control：no-cache# 缓存实现的机制。
Connection：keep-alive
Host：192.168.0.40# 访问的名称（主机名还是 IP 地址），虚拟主机就是依靠这个字段来判断返回哪个页面内容
Pragma：no-cache#http1.0 使用的字段，如果是 no-cache 与 cache-control 功能一致
Upgrade-Insecure-Requests：1 # 客户端优先选择加密及带有身份验证的响应
User-Agent：Mozilla/5.0 (X11; Linux x86_64…) Firefox/60.0	# 客户端浏览器类型和版本

以上只是对在发者工具中看到的内容进行的说明，有需要的同学，或者是如果以后看到了其它额外字段的内容可以参看 https://developer.mozilla.org/zh-CN/docs/Web/HTTP，里面有详细的说明

基于 host 分发这种分发方式适用于多集群分发。例如：一个公司有多个网站，每个网站就是一个集群。

 #nginx 分发器设置
http {upstream web1 {   # 名为 web1 的反向代理群组
        server 192.168.0.42;
    }
    upstream web2 {# 名为 web2 的反向代理群组
        server 192.168.0.43;
    }
    server {# web1 虚拟主机
        listen 80;
        server_name www.web1.com;    # 基于域名分发必须有域名
        location / {proxy_pass http://web1;}
    }
    server {# web2 虚拟主机
        listen 80;
        server_name www.web2.com;    # 基于域名分发必须有域名 
        location / {proxy_pass http://web2;}
    }
}

 # 客户端测试机设置
[root@client ~]# vim /etc/hosts
168.0.40 www.web1.com
192.168.0.40 www.web2.com
[root@client ~]# curl www.web1.com
web1
[root@client ~]# curl www.web2.com
web2

这种分发方式适用于混合开发的网站，某些大型网站既有 php 也有 jsp，就可以基于开发语言分发。

 # 192.168.0.40 分发器上 nginx 配置
http {
    upstream php {server 192.168.0.42; 
    }
    upstream html {server 192.168.0.43;
    }
    server {location ~* \.php$ {    # 以 php 结尾的
            proxy_pass http://php;
        } 
        location ~* \.html$ {# 以 html 结尾的
            proxy_pass http://html;
        }
    }
}

测试验证：

 # 在 web1 这台主机上安装 php 环境
[root@web1 ~]# dnf -y install php# 安装 php
# 启动 apache，自带 php
[root@web1 ~]# systemctl restart httpd
 
# 编写 php 文件
[root@web1 ~]# echo "<?php phpinfo(); ?>" > /var/www/html/index.php
 
# 访问 192.168.0.40/index.php 可以看到 php-info 信息页面
# 访问 192.168.0.40/index.html 可以看到 web2

这种基于浏览器的分发，常应用于 PC 端和移动端区分或浏览器适配。

部署第三台业务主机

 [root@web3 ~]# dnf install httpd -y
[root@web3 ~]# echo web3 > /var/www/html/index.html
[root@web3 ~]# systemctl restart httpd
[root@web3 ~]# curl localhost

配置基于浏览器的分发

 upstream curl {server 192.168.0.42; }
upstream firefox {server 192.168.0.43; }
upstream other {server 192.168.0.44; }
server {listen 80;
    server_name www.web1.com;
    location / {
        proxy_pass http://other;
        if ($http_user_agent ~* curl ) {proxy_pass http://curl;}
        if ($http_user_agent ~* firefox ) {proxy_pass http://firefox;}
    }
}

测试

使用不同的浏览器访问分发器会得到不同的页面

像腾讯新闻，网易，58 同城，真爱，百合，赶集，智联等等很多网站, 这种网站都有一个特性，你一访问，就知道你的位置，然后根据你的位置，给你推荐或者展示相关内容。很多 APP 也是这样的，只不过，网站是通过你的源 IP 来确定你的位置，APP 的则更为直接一些，通过定位数据获取位置。比如说，你去新闻类的网站，这些网站的本地新版板块显示的都是你所在地的相关信息。也就是说我们可以让服务器对源 IP 进行判断，根据判断的结果不同，再返回不同的数据给客户端；如果判断不出来，就按照默认去处理。如果想实现基于源 IP 的分发我们需要一个叫 geo 的参数，这个参数可以要根据客户端 ip 访问到不同的 server，它是通过一个叫 ngx_http_geo_module 模块提供的。默认情况下，nginx 安装时是会自动加载这个模块，除非安装时人为的手动添加–without-http_geo_module。

配置

 upstream bj.server {server 192.168.0.42;    # web01
}
upstream sh.server {server 192.168.0.43;      # web02
}
upstream default.server {server 192.168.0.44;      # web03
}
geo $geo {# IP 库
    default default;
    192.168.0.10/32 bj;    # 北京
    192.168.0.20/32 sh;   # 上海
}
server {listen  80;
    server_name   www.web1.com;
 
    location / {proxy_pass http://$geo.server$request_uri;
    }
}

如果客户端地址是 0.10 就访问北京，如果是 0.20 就访问上海，如果不是 0.10 也不是 0.20 就按照 default 处理，线上环境这里面就是个 IP 库我现在没有 ip 库只能写两个 IP 来代表看下后面的掩码是 32 表示这一个网段只有这一个 IP 吧，当然你也可以换成网段。

http 后面加上 $request_uri 的原因就是避免客户找你拿数据的时候一指定 URI 你就无法正常代理了，目的就是保证客户在访问类似 http://www.a.com/a/b/c/d.jpg 这样的网址的时候可以正常访问也就是说当用户请求的 URL 当中的 URI 跟着变化的时候你的代理服务器一样可以正常工作

重启 nginx 服务器，切换到客户端测试

 [root@client ~]# ifconfig
ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.0.10  netmask 255.255.255.0  broadcast 192.168.0.255
        inet6 fe80::2386:3dbd:531c:7bc1  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:a6:ad:95  txqueuelen 1000  (Ethernet)
        RX packets 1177  bytes 280850 (274.2 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 1115  bytes 111602 (108.9 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
 
lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 127.0.0.1  netmask 255.0.0.0
        inet6 ::1  prefixlen 128  scopeid 0x10<host>
        loop  txqueuelen 1000  (Local Loopback)
        RX packets 7080  bytes 601912 (587.8 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 7080  bytes 601912 (587.8 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
 
[root@client ~]# curl 192.168.0.40
web1
[root@client ~]# nmcli connection modify ens33 ipv4.addresses 192.168.0.20/24 ipv4.method manual autoconnect yes
[root@client ~]# nmcli connection down ens33
成功停用连接 "ens33"（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/16）[root@client ~]# nmcli connection up ens33
连接已成功激活（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/17）[root@client ~]# curl 192.168.0.40
web2
[root@client ~]# nmcli connection modify ens33 ipv4.addresses 192.168.0.30/24 ipv4.method manual autoconnect yes
[root@client ~]# nmcli connection down ens33
成功停用连接 "ens33"（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/17）[root@client ~]# nmcli connection up ens33
连接已成功激活（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/18）[root@client ~]# curl 192.168.0.40
web3

正文完

星哥玩云-微信公众号

Nginx基于请求头的分发

发表至： linux教程

2022-06-09

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

最有名的文字冒险游戏 – 巨洞冒险

私有云中的安全风险如何防范

简单介绍lodash里的toLength和toPairs方法

如何使用 awk 的 ‘next’ 命令

影响Angular和React应用安全的漏洞分析

5G消息三种类型

2020需要掌握的Linux学习方法有哪些？

Linux的学习技巧

Nginx分发算法

Nginx基于请求头的分发

一、HTTP 请求头和响应头

二、基于请求头的分发

2.1、基于 host 分发

2.2、基于域名的分发测试：

2.3、基于开发语言分发

2.4、基于浏览器分发

2.5、基于源 IP 分发

申请腾讯混元的API Key并且使用LobeChat调用混元AI

Docker部署搭建一个开源强大的图书管理系统

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

让每个人都可以轻松使用Git-腾讯自研Git客户端

使用Docker部署开源的WPS-Office

Linux下Docker安装配置

阿里云和腾讯云哪个好？服务器哪个速度快？

通知：阿里云对象存储OSS价格下调（最高优惠降幅55%）

使用 yum-cron 自动更新 Linux系统

实例：同步阿里云RDS库到自建mysql库

	Request URL: http://192.168.0.40 # 请求的 URL
	Request method:GET # 请求的方法，GET 是获取数据
	Remote address:192.168.0.40:80# 远程主机的地址
	Status code: 200 OK # 请求代码，200 表示正常，如果页面无法打开会显示 404，403 等
	Version: HTTP/1.1#HTTP 协议的版本


	Response headers (235 B) # 响应头
	Accept-Ranges：bytes# 接受范围，如果出现此字段表示，这是一个续传的下载（断点续传），bytes 表示服务器可接受范围请求的单位是 bytes，none 表示不支持
	Connection：keep-alive # 是否支持长连接，从 HTTP1.1 开始默认
	Content-Length：5 # 返回的数据长度，单位为字节
	Content-Type：text/html# 页面类型，文本、图片、视频、音频
	Date：Fri, 21 Feb 2020 01:37:17 GMT# 返回的时间
	ETag："5e4e2e62-5"# 验证标签，用来帮助控制缓存验证，当浏览器请求服务器的某项资源 (A) 时, 服务器根据 A 算出一个哈希值，并通过 ETag 返回给浏览器，浏览器把对应的哈希值和 A 同时缓存在本地，当下次再次向服务器请求 A 时，会把这个哈希值发送给服务器，服务器再次计算 A 的哈希值并和刚刚接收到的哈希值做比较，如果发现 A 发生了变化就把 A 返回给浏览器(200)，如果发现 A 没有变化就给浏览器返回一个 304 未修改。这样通过控制浏览器端的缓存，可以节省服务器的带宽，因为服务器不需要每次都把全量数据返回给客户端
	Last-Modified：Thu, 20 Feb 2020 06:59:46 GMT# 服务器认定的资源做出修改的日期及时间。它通常被用作判断接收到的或者存储的资源是否一致。由于精确度比 ETag 要低，所以这是一个备用机制。
	Server：nginx/1.15.12 # 服务器的软件类型和版本


	Request headers (355 B) # 请求头
	Accept：text/html,application/xhtml+xm… # 接受的数据类型
	Accept-Encoding：gzip, deflate # 是否支持压缩，及类型
	Accept-Language：en-US,en;q=0.5 # 语言环境
	Cache-Control：no-cache# 缓存实现的机制。
	Connection：keep-alive
	Host：192.168.0.40# 访问的名称（主机名还是 IP 地址），虚拟主机就是依靠这个字段来判断返回哪个页面内容
	Pragma：no-cache#http1.0 使用的字段，如果是 no-cache 与 cache-control 功能一致
	Upgrade-Insecure-Requests：1 # 客户端优先选择加密及带有身份验证的响应
	User-Agent：Mozilla/5.0 (X11; Linux x86_64…) Firefox/60.0 # 客户端浏览器类型和版本

	#nginx 分发器设置
	http {upstream web1 { # 名为 web1 的反向代理群组
	server 192.168.0.42;
	}
	upstream web2 {# 名为 web2 的反向代理群组
	server 192.168.0.43;
	}
	server {# web1 虚拟主机
	listen 80;
	server_name www.web1.com; # 基于域名分发必须有域名
	location / {proxy_pass http://web1;}
	}
	server {# web2 虚拟主机
	listen 80;
	server_name www.web2.com; # 基于域名分发必须有域名
	location / {proxy_pass http://web2;}
	}
	}

	# 客户端测试机设置
	[root@client ~]# vim /etc/hosts
	168.0.40 www.web1.com
	192.168.0.40 www.web2.com
	[root@client ~]# curl www.web1.com
	web1
	[root@client ~]# curl www.web2.com
	web2

	# 192.168.0.40 分发器上 nginx 配置
	http {
	upstream php {server 192.168.0.42;
	}
	upstream html {server 192.168.0.43;
	}
	server {location ~* \.php$ { # 以 php 结尾的
	proxy_pass http://php;
	}
	location ~* \.html$ {# 以 html 结尾的
	proxy_pass http://html;
	}
	}
	}

	# 在 web1 这台主机上安装 php 环境
	[root@web1 ~]# dnf -y install php# 安装 php
	# 启动 apache，自带 php
	[root@web1 ~]# systemctl restart httpd

	# 编写 php 文件
	[root@web1 ~]# echo "<?php phpinfo(); ?>" > /var/www/html/index.php

	# 访问 192.168.0.40/index.php 可以看到 php-info 信息页面
	# 访问 192.168.0.40/index.html 可以看到 web2

	[root@web3 ~]# dnf install httpd -y
	[root@web3 ~]# echo web3 > /var/www/html/index.html
	[root@web3 ~]# systemctl restart httpd
	[root@web3 ~]# curl localhost

	upstream curl {server 192.168.0.42; }
	upstream firefox {server 192.168.0.43; }
	upstream other {server 192.168.0.44; }
	server {listen 80;
	server_name www.web1.com;
	location / {
	proxy_pass http://other;
	if ($http_user_agent ~* curl ) {proxy_pass http://curl;}
	if ($http_user_agent ~* firefox ) {proxy_pass http://firefox;}
	}
	}

	upstream bj.server {server 192.168.0.42; # web01
	}
	upstream sh.server {server 192.168.0.43; # web02
	}
	upstream default.server {server 192.168.0.44; # web03
	}
	geo $geo {# IP 库
	default default;
	192.168.0.10/32 bj; # 北京
	192.168.0.20/32 sh; # 上海
	}
	server {listen 80;
	server_name www.web1.com;

	location / {proxy_pass http://$geo.server$request_uri;
	}
	}

	[root@client ~]# ifconfig
	ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
	inet 192.168.0.10 netmask 255.255.255.0 broadcast 192.168.0.255
	inet6 fe80::2386:3dbd:531c:7bc1 prefixlen 64 scopeid 0x20<link>
	ether 00:0c:29:a6:ad:95 txqueuelen 1000 (Ethernet)
	RX packets 1177 bytes 280850 (274.2 KiB)
	RX errors 0 dropped 0 overruns 0 frame 0
	TX packets 1115 bytes 111602 (108.9 KiB)
	TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0

	lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
	inet 127.0.0.1 netmask 255.0.0.0
	inet6 ::1 prefixlen 128 scopeid 0x10<host>
	loop txqueuelen 1000 (Local Loopback)
	RX packets 7080 bytes 601912 (587.8 KiB)
	RX errors 0 dropped 0 overruns 0 frame 0
	TX packets 7080 bytes 601912 (587.8 KiB)
	TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0

	[root@client ~]# curl 192.168.0.40
	web1
	[root@client ~]# nmcli connection modify ens33 ipv4.addresses 192.168.0.20/24 ipv4.method manual autoconnect yes
	[root@client ~]# nmcli connection down ens33
	成功停用连接 "ens33"（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/16）[root@client ~]# nmcli connection up ens33
	连接已成功激活（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/17）[root@client ~]# curl 192.168.0.40
	web2
	[root@client ~]# nmcli connection modify ens33 ipv4.addresses 192.168.0.30/24 ipv4.method manual autoconnect yes
	[root@client ~]# nmcli connection down ens33
	成功停用连接 "ens33"（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/17）[root@client ~]# nmcli connection up ens33
	连接已成功激活（D-Bus 活动路径：/org/freedesktop/NetworkManager/ActiveConnection/18）[root@client ~]# curl 192.168.0.40
	web3