Python中urllib库读取网站相关信息的方法

2026-04-30 04:32:33

1、用 import 代码导入 urllib库，具体如下：

import urllib.request

2、建立一个变量名称为 url 赋值为我们需要获取的网站地址，具体代码如下：

url = "http://m.sinovision.net/newpneumonia.php"

Python中urllib库读取网站相关信息的方法

3、建立一个变量名称为 res，用urllib.request.urlopen() 发送请求

具体代码如下：

res = urllib.request.urlopen(url)

Python中urllib库读取网站相关信息的方法

4、接下来我们获取相关信息，代码如下：

print(res.status)

print(res.geturl())
print(res.getcode())
print(res.info())

res.status 为获取状态码

res.geturl() 为获取url

res.info() 为获取响应头

res.getcode() 为获取状态码

Python中urllib库读取网站相关信息的方法

5、运行此程序，查看打印结果，效果如图所示。我们已经打印出了状态码为200

url地址，以及状态头。

Python中urllib库读取网站相关信息的方法

6、接下来我们建立变量名称为web ，用read方法读取网页源码

web = res.read().decode("utf8")

Python中urllib库读取网站相关信息的方法

7、用文件写入方法，把读取出来的源码保存到文件当中，具体代码如下：

f = open("html",mode="w",encoding="utf8")

f.write(web)
f.flush()
f.close()

Python中urllib库读取网站相关信息的方法

8、运行整个代码，出现了名称为html 的文档，里面内容为网站的源码，效果如图

Python中urllib库读取网站相关信息的方法

9、整体代码总结：

import urllib.request

url = "http://m.sinovision.net/newpneumonia.php"
res = urllib.request.urlopen(url)
print(res.status)
print(res.geturl())
print(res.getcode())
print(res.info())
web = res.read().decode("utf8")
f = open("html",mode="w",encoding="utf8")
f.write(web)
f.flush()
f.close()

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。