Python中urllib库读取网站相关信息的方法

2025-10-20 08:31:25

1、用 import 代码导入 urllib库,具体如下:

import urllib.request

Python中urllib库读取网站相关信息的方法

2、建立一个变量 名称为 url 赋值为我们需要获取的网站地址,具体代码如下:

url = "http://m.sinovision.net/newpneumonia.php"

Python中urllib库读取网站相关信息的方法

3、建立一个变量名称为 res,用urllib.request.urlopen() 发送请求

具体代码如下:

res = urllib.request.urlopen(url)

Python中urllib库读取网站相关信息的方法

4、接下来我们获取相关信息,代码如下:

print(res.status)

 

print(res.geturl())

 

print(res.getcode())

 

print(res.info())

res.status     为获取状态码

res.geturl()   为获取url 

res.info()       为获取响应头

res.getcode() 为获取状态码

Python中urllib库读取网站相关信息的方法

5、运行此程序,查看打印结果,效果如图所示。我们已经打印出了状态码为200

url地址 ,以及状态头。

Python中urllib库读取网站相关信息的方法

6、接下来我们建立变量名称为web ,用read方法读取网页源码

web = res.read().decode("utf8")

Python中urllib库读取网站相关信息的方法

7、用文件写入方法,把读取出来的源码保存到文件当中,具体代码如下:

f = open("html",mode="w",encoding="utf8")

 

f.write(web)

 

f.flush()

 

f.close()

Python中urllib库读取网站相关信息的方法

8、运行整个代码,出现了名称为html 的文档,里面内容为网站的源码,效果如图

Python中urllib库读取网站相关信息的方法

9、整体代码总结:

import urllib.request

 

url = "http://m.sinovision.net/newpneumonia.php"

 

res = urllib.request.urlopen(url)

 

print(res.status)

 

print(res.geturl())

 

print(res.getcode())

 

print(res.info())

 

web = res.read().decode("utf8")

 

f = open("html",mode="w",encoding="utf8")

 

f.write(web)

 

f.flush()

 

f.close()

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢