Python中urllib库读取网站相关信息的方法
1、用 import 代码导入 urllib库,具体如下:
import urllib.request

2、建立一个变量 名称为 url 赋值为我们需要获取的网站地址,具体代码如下:
url = "http://m.sinovision.net/newpneumonia.php"

3、建立一个变量名称为 res,用urllib.request.urlopen() 发送请求
具体代码如下:
res = urllib.request.urlopen(url)

4、接下来我们获取相关信息,代码如下:
print(res.status)
print(res.geturl())
print(res.getcode())
print(res.info())
res.status 为获取状态码
res.geturl() 为获取url
res.info() 为获取响应头
res.getcode() 为获取状态码

5、运行此程序,查看打印结果,效果如图所示。我们已经打印出了状态码为200
url地址 ,以及状态头。

6、接下来我们建立变量名称为web ,用read方法读取网页源码
web = res.read().decode("utf8")

7、用文件写入方法,把读取出来的源码保存到文件当中,具体代码如下:
f = open("html",mode="w",encoding="utf8")
f.write(web)
f.flush()
f.close()

8、运行整个代码,出现了名称为html 的文档,里面内容为网站的源码,效果如图

9、整体代码总结:
import urllib.request
url = "http://m.sinovision.net/newpneumonia.php"
res = urllib.request.urlopen(url)
print(res.status)
print(res.geturl())
print(res.getcode())
print(res.info())
web = res.read().decode("utf8")
f = open("html",mode="w",encoding="utf8")
f.write(web)
f.flush()
f.close()
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:76
阅读量:27
阅读量:48
阅读量:155
阅读量:173