使用正则表达式匹配URL中的域名

在WEB开发中有时候需要替换URL中的域名,而且在内部网测试环境中存在类似http://msnbc-test:1180/的URL,

可以以”http://”开始到下一个”/”作为匹配URL中域名的模式。

import re

orig_url = “http://test2-as.3456.chenpeng.info/~rosen/161/notes/hopfield.html”
result = re.findall(r”^http://.*?/”, orig_url)
print result
exit()

 

Process started >>>
[‘http://test2-as.3456.chenpeng.info/’]
<<< Process finished. (Exit code 0)

 

代码中正则表达式”http://.*?/“具体解释如下:

1.”http://”匹配URL中开头的”http://”.

2.”.*”匹配任意长度的任意字符串,”*”正则表达的贪婪性会匹配尽量长的字符串。

3.”?/”匹配遇到的第一个”/”,”?”正则表达的惰性会匹配尽量短的字符串。

About 智足者富

http://chenpeng.info

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>