简单介绍正则表达式拆分url实例代码

80次阅读

共计 1075 个字符，预计需要花费 3 分钟才能阅读完成。

导读	这篇文章主要给大家介绍了关于正则表达式拆分 url 的相关资料, 文中通过实例代码介绍的非常详细, 对大家的学习或者工作具有一定的参考学习价值, 需要的朋友可以参考下

背景

做 web 开发的同学，经常会有从 url 中获取二级域名或者主域名或者参数等等需求，需要扎实的正则功底。本文提供一个全面的 url 拆分案例，需要哪个部分用哪个部分。

案例

将 url 的各个部分拆开，让我想取哪部分就取哪部分？

url: http://www.baidu.com/love/java?lang=java
regex: (\w+):\/\/([^/:]+)(:\d*)?([^#]*)

使用 js 举例

var url = "http://www.baidu.com:80/love/java?lang=java";
var patt1 = /(\w+):\/\/([^/:]+)(:\d*)?([^#]*)/;
arr = url.match(patt1);
for (var i = 0; i ");
}

输出结果如下：

http://www.baidu.com:80/love/java?lang=java
http
www.baidu.com
:80
/love/java?lang=java

使用 java 举例

String url = "http://www.baidu.com:80/love/java?lang=java";
Pattern pattern = Pattern.compile("(\\w+):\\/\\/([^/:]+)(:\\d*)?([^#]*)");
Matcher matcher = pattern.matcher(url);
matcher.find();
for (int i = 1; i 
 输出结果：
http
www.baidu.com
:80
/love/java?lang=java
 正则说明 
 实例中的数组包含 5 个元素，索引 0 对应的是整个字符串，索引 1 对应第一个匹配符（括号内），以此类推。
 第一个括号子表达式捕获 Web 地址的协议部分。该子表达式匹配在冒号和两个正斜杠前面的任何单词。
 第二个括号子表达式捕获地址的域地址部分。子表达式匹配非 : 和 / 之后的一个或多个字符。
 第三个括号子表达式捕获端口号（如果指定了的话）。该子表达式匹配冒号后面的零个或多个数字。只能重复一次该子表达式。
 第四个括号子表达式捕获 Web 地址指定的路径和 / 或页信息。该子表达式能匹配不包括 # 或空格字符的任何字符序列。
 到此这篇关于正则表达式拆分 url 的文章就介绍到这了。

 阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年，有高配 
 腾讯云新客低至 82 元 / 年，老客户 99 元 / 年 
 代金券：在阿里云专用满减优惠券