js正则表达式之URL格式匹配

2025-10-10 16:33:02

1、代码与执行结果

js正则表达式之URL格式匹配

js正则表达式之URL格式匹配

2、元字符解释

脱字符 ^ :一行的第一个字符,

字符组[…]:表示匹配里面任何一个字符,但是必须要有一个匹配。

排除字符组 [^…]:表示排除里面所有字符,

括号(…):表示限定或界定

0-9、a-z:表示取值范围

量词 + :表示前面那个字符或组至少匹配一次

量词 ? : 表示前面那个字符或组匹配0次或1次。

量词 * :表示前面那个字符或组匹配0次或多次。

3、协议匹配规则

常见URL协议有http、https等等,所以这里就做针对http和https的URL地址匹配。

匹配规则 :^(https?:\/\/)

4、主机名匹配规则

主机名格式为:xxx.xxx.xxx 或 xxx.xxx 2种形式 由字母或数字组成。

如:www.baidu.com  baidu.com  127.0.0.1

匹配规则为:([0-9a-zA-z.]+)

5、端口匹配

端口部分是由冒号开头后接数值两部分组成而且web默认端口80是不显示在后面的,所以就有2种情况存在或不存在。

如:127.0.0.1:8080  127.0.0.0

匹配规则为:(:[0-9]+)?

6、路径匹配

路径是由字母、数字、斜杠、点组成。在访问网站首页时后面没有路径地址,所以这块如果存在就匹配。

如:/xxx/xxxx/xxx.html 、 /xxx/xxx

匹配规则为:([/0-9a-zA-Z.]+)?

7、查询字符串匹配

查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。

匹配规则为:(\?[0-9a-zA-Z&=]+)?

8、信息片断匹配

信息片断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。

匹配规则为:(#[0-9-a-zA-Z]+)?

9、组合匹配规则

采用i不区别大小写模式,来简化一下匹配规则

/^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(\?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢