Web基础

共计 5023 个字符，预计需要花费 13 分钟才能阅读完成。

今天我们访问网站，使用 App 时，都是基于 Web 这种 Browser/Server 模式，简称 BS 架构，它的特点是，客户端只需要浏览器，应用程序的逻辑和数据都存储在服务器端。浏览器只需要请求服务器，获取 Web 页面，并把 Web 页面展示给用户即可。

Web 页面具有极强的交互性。由于 Web 页面是用 HTML 编写的，而 HTML 具备超强的表现力，并且，服务器端升级后，客户端无需任何部署就可以使用到新的版本，因此，BS 架构升级非常容易。

在 Web 应用中，浏览器请求一个 URL，服务器就把生成的 HTML 网页发送给浏览器，而浏览器和服务器之间的传输协议是 HTTP，所以：

HTML 是一种用来定义网页的文本，会 HTML，就可以编写网页；
HTTP 是在网络上传输 HTML 的协议，用于浏览器和服务器的通信。

HTTP 协议是一个基于 TCP 协议之上的请求 - 响应协议，它非常简单，我们先使用 Chrome 浏览器查看新浪首页，然后选择 View – Developer – Inspect Elements 就可以看到 HTML：

Web 基础

切换到 Network，重新加载页面，可以看到浏览器发出的每一个请求和响应：

Web 基础

对于 Browser 来说，请求页面的流程如下：

与服务器建立 TCP 连接；
发送 HTTP 请求；
收取 HTTP 响应，然后把网页在浏览器中显示出来。

浏览器发送的 HTTP 请求如下：

 GET / HTTP/1.1
Host: www.sina.com.cn
User-Agent: Mozilla/5.0 xxx
Accept: */*
Accept-Language: zh-CN,zh;q=0.9,en-US;q=0.8

其中，第一行表示使用 GET 请求获取路径为 / 的资源，并使用 HTTP/1.1 协议，从第二行开始，每行都是以 Header: Value 形式表示的 HTTP 头，比较常用的 HTTP Header 包括：

Host: 表示请求的主机名，因为一个服务器上可能运行着多个网站，因此，Host 表示浏览器正在请求的域名；
User-Agent: 标识客户端本身，例如 Chrome 浏览器的标识类似Mozilla/5.0 ... Chrome/79，IE 浏览器的标识类似Mozilla/5.0 (Windows NT ...) like Gecko；
Accept：表示浏览器能接收的资源类型，如 text/*，image/* 或者 */* 表示所有；
Accept-Language：表示浏览器偏好的语言，服务器可以据此返回不同语言的网页；
Accept-Encoding：表示浏览器可以支持的压缩类型，例如gzip, deflate, br。

服务器的响应如下：

 HTTP/1.1 200 OK
Content-Type: text/html
Content-Length: 21932
Content-Encoding: gzip
Cache-Control: max-age=300
 
<html>... 网页数据...

服务器响应的第一行总是版本号 + 空格 + 数字 + 空格 + 文本，数字表示响应代码，其中 2xx 表示成功，3xx表示重定向，4xx表示客户端引发的错误，5xx表示服务器端引发的错误。数字是给程序识别，文本则是给开发者调试使用的。常见的响应代码有：

200 OK：表示成功；
301 Moved Permanently：表示该 URL 已经永久重定向；
302 Found：表示该 URL 需要临时重定向；
304 Not Modified：表示该资源没有修改，客户端可以使用本地缓存的版本；
400 Bad Request：表示客户端发送了一个错误的请求，例如参数无效；
401 Unauthorized：表示客户端因为身份未验证而不允许访问该 URL；
403 Forbidden：表示服务器因为权限问题拒绝了客户端的请求；
404 Not Found：表示客户端请求了一个不存在的资源；
500 Internal Server Error：表示服务器处理时内部出错，例如因为无法连接数据库；
503 Service Unavailable：表示服务器此刻暂时无法处理请求。

从第二行开始，服务器每一行均返回一个 HTTP 头。服务器经常返回的 HTTP Header 包括：

Content-Type：表示该响应内容的类型，例如text/html，image/jpeg；
Content-Length：表示该响应内容的长度（字节数）；
Content-Encoding：表示该响应压缩算法，例如gzip；
Cache-Control：指示客户端应如何缓存，例如 max-age=300 表示可以最多缓存 300 秒。

HTTP 请求和响应都由 HTTP Header 和 HTTP Body 构成，其中 HTTP Header 每行都以 \r\n 结束。如果遇到两个连续的 \r\n，那么后面就是 HTTP Body。浏览器读取 HTTP Body，并根据 Header 信息中指示的Content-Type、Content-Encoding 等解压后显示网页、图像或其他内容。

通常浏览器获取的第一个资源是 HTML 网页，在网页中，如果嵌入了 JavaScript、CSS、图片、视频等其他资源，浏览器会根据资源的 URL 再次向服务器请求对应的资源。

关于 HTTP 协议的详细内容，请参考 HTTP 权威指南一书，或者 Mozilla 开发者网站。

我们在前面介绍的 HTTP 编程是以客户端的身份去请求服务器资源。现在，我们需要以服务器的身份响应客户端请求，编写服务器程序来处理客户端请求通常就称之为 Web 开发。

我们来看一下如何编写 HTTP Server。一个 HTTP Server 本质上是一个 TCP 服务器，我们先用 TCP 编程的多线程实现的服务器端框架：

 public class Server {public static void main(String[] args) throws IOException {ServerSocket ss = new ServerSocket(8080); // 监听指定端口
        System.out.println("server is running...");
        for (;;) {Socket sock = ss.accept();
            System.out.println("connected from" + sock.getRemoteSocketAddress());
            Thread t = new Handler(sock);
            t.start();}
    }
}
 
class Handler extends Thread {
    Socket sock;
 
    public Handler(Socket sock) {this.sock = sock;
    }
 
    public void run() {try (InputStream input = this.sock.getInputStream()) {try (OutputStream output = this.sock.getOutputStream()) {handle(input, output);
            }
        } catch (Exception e) {} finally {try {this.sock.close();} catch (IOException ioe) { }
            System.out.println("client disconnected.");
        }
    }
 
    private void handle(InputStream input, OutputStream output) throws IOException {var reader = new BufferedReader(new InputStreamReader(input, StandardCharsets.UTF_8));
        var writer = new BufferedWriter(new OutputStreamWriter(output, StandardCharsets.UTF_8));
        // TODO: 处理 HTTP 请求
    }
}

只需要在 handle() 方法中，用 Reader 读取 HTTP 请求，用 Writer 发送 HTTP 响应，即可实现一个最简单的 HTTP 服务器。编写代码如下：

 private void handle(InputStream input, OutputStream output) throws IOException {System.out.println("Process new http request...");
    var reader = new BufferedReader(new InputStreamReader(input, StandardCharsets.UTF_8));
    var writer = new BufferedWriter(new OutputStreamWriter(output, StandardCharsets.UTF_8));
    // 读取 HTTP 请求:
    boolean requestOk = false;
    String first = reader.readLine();
    if (first.startsWith("GET / HTTP/1.")) {requestOk = true;
    }
    for (;;) {String header = reader.readLine();
        if (header.isEmpty()) {// 读取到空行时, HTTP Header 读取完毕
            break;
        }
        System.out.println(header);
    }
    System.out.println(requestOk ? "Response OK" : "Response Error");
    if (!requestOk) {// 发送错误响应:
        writer.write("HTTP/1.0 404 Not Found\r\n");
        writer.write("Content-Length: 0\r\n");
        writer.write("\r\n");
        writer.flush();} else {// 发送成功响应:
        String data = "<html><body><h1>Hello, world!</h1></body></html>";
        int length = data.getBytes(StandardCharsets.UTF_8).length;
        writer.write("HTTP/1.0 200 OK\r\n");
        writer.write("Connection: close\r\n");
        writer.write("Content-Type: text/html\r\n");
        writer.write("Content-Length:" + length + "\r\n");
        writer.write("\r\n"); // 空行标识 Header 和 Body 的分隔
        writer.write(data);
        writer.flush();}
}

这里的核心代码是，先读取 HTTP 请求，这里我们只处理 GET / 的请求。当读取到空行时，表示已读到连续两个 \r\n，说明请求结束，可以发送响应。发送响应的时候，首先发送响应代码HTTP/1.0 200 OK 表示一个成功的 200 响应，使用 HTTP/1.0 协议，然后，依次发送 Header，发送完 Header 后，再发送一个空行标识 Header 结束，紧接着发送 HTTP Body，在浏览器输入 http://local.liaoxuefeng.com:8080/ 就可以看到响应页面：

Web 基础

HTTP 目前有多个版本，1.0是早期版本，浏览器每次建立 TCP 连接后，只发送一个 HTTP 请求并接收一个 HTTP 响应，然后就关闭 TCP 连接。由于创建 TCP 连接本身就需要消耗一定的时间，因此，HTTP 1.1 允许浏览器和服务器在同一个 TCP 连接上反复发送、接收多个 HTTP 请求和响应，这样就大大提高了传输效率。

我们注意到 HTTP 协议是一个请求 - 响应协议，它总是发送一个请求，然后接收一个响应。能不能一次性发送多个请求，然后再接收多个响应呢？HTTP 2.0 可以支持浏览器同时发出多个请求，但每个请求需要唯一标识，服务器可以不按请求的顺序返回多个响应，由浏览器自己把收到的响应和请求对应起来。可见，HTTP 2.0 进一步提高了传输效率，因为浏览器发出一个请求后，不必等待响应，就可以继续发下一个请求。

HTTP 3.0 为了进一步提高速度，将抛弃 TCP 协议，改为使用无需创建连接的 UDP 协议，目前 HTTP 3.0 仍然处于实验阶段。

编写一个简单的 HTTP 服务器。

下载练习

使用 B / S 架构时，总是通过 HTTP 协议实现通信；

Web 开发通常是指开发服务器端的 Web 应用程序。

HTTP 协议

编写 HTTP Server

练习

小结

申请腾讯混元的API Key并且使用LobeChat调用混元AI

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

让每个人都可以轻松使用Git-腾讯自研Git客户端

使用Docker部署开源的WPS-Office

简单介绍常用hadoop dfs命令

Ubuntu nginx和安全狗的安装与配置

让每个人都可以轻松使用Git-腾讯自研Git客户端

路由器改装git服务器之路

今天聊聊：每个 Linux 新手都应该知道的四个命令

Oracle12.2创建数据库遇到的一些问题

	GET / HTTP/1.1
	Host: www.sina.com.cn
	User-Agent: Mozilla/5.0 xxx
	Accept: /
	Accept-Language: zh-CN,zh;q=0.9,en-US;q=0.8

	HTTP/1.1 200 OK
	Content-Type: text/html
	Content-Length: 21932
	Content-Encoding: gzip
	Cache-Control: max-age=300

	<html>... 网页数据...

	public class Server {public static void main(String[] args) throws IOException {ServerSocket ss = new ServerSocket(8080); // 监听指定端口
	System.out.println("server is running...");
	for (;;) {Socket sock = ss.accept();
	System.out.println("connected from" + sock.getRemoteSocketAddress());
	Thread t = new Handler(sock);
	t.start();}
	}
	}

	class Handler extends Thread {
	Socket sock;

	public Handler(Socket sock) {this.sock = sock;
	}

	public void run() {try (InputStream input = this.sock.getInputStream()) {try (OutputStream output = this.sock.getOutputStream()) {handle(input, output);
	}
	} catch (Exception e) {} finally {try {this.sock.close();} catch (IOException ioe) { }
	System.out.println("client disconnected.");
	}
	}

	private void handle(InputStream input, OutputStream output) throws IOException {var reader = new BufferedReader(new InputStreamReader(input, StandardCharsets.UTF_8));
	var writer = new BufferedWriter(new OutputStreamWriter(output, StandardCharsets.UTF_8));
	// TODO: 处理 HTTP 请求
	}
	}

	private void handle(InputStream input, OutputStream output) throws IOException {System.out.println("Process new http request...");
	var reader = new BufferedReader(new InputStreamReader(input, StandardCharsets.UTF_8));
	var writer = new BufferedWriter(new OutputStreamWriter(output, StandardCharsets.UTF_8));
	// 读取 HTTP 请求:
	boolean requestOk = false;
	String first = reader.readLine();
	if (first.startsWith("GET / HTTP/1.")) {requestOk = true;
	}
	for (;;) {String header = reader.readLine();
	if (header.isEmpty()) {// 读取到空行时, HTTP Header 读取完毕
	break;
	}
	System.out.println(header);
	}
	System.out.println(requestOk ? "Response OK" : "Response Error");
	if (!requestOk) {// 发送错误响应:
	writer.write("HTTP/1.0 404 Not Found\r\n");
	writer.write("Content-Length: 0\r\n");
	writer.write("\r\n");
	writer.flush();} else {// 发送成功响应:
	String data = "<html><body><h1>Hello, world!</h1></body></html>";
	int length = data.getBytes(StandardCharsets.UTF_8).length;
	writer.write("HTTP/1.0 200 OK\r\n");
	writer.write("Connection: close\r\n");
	writer.write("Content-Type: text/html\r\n");
	writer.write("Content-Length:" + length + "\r\n");
	writer.write("\r\n"); // 空行标识 Header 和 Body 的分隔
	writer.write(data);
	writer.flush();}
	}