Python3使用urllib爬取简单页面

2026-04-22 15:30:31

1、打开Python开发工具IDLE，新建‘url.py’文件，编写代码如下：

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.read())

Python3使用urllib爬取简单页面

2、F5运行程序，获取到百度的首页的页面，打印源代码到Shell

Python3使用urllib爬取简单页面

3、改写代码，打印百度返回状态码

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

Python3使用urllib爬取简单页面

4、F5运行程序，打印出请求返回状态码200

200 代表正常

500 服务器出错

400 请求参数异常

Python3使用urllib爬取简单页面

5、改写代码，打印请求url地址

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

print (resp.geturl())

Python3使用urllib爬取简单页面

6、F5运行程序，打印出发起访问百度url

Python3使用urllib爬取简单页面

7、改写代码，打印返回头部信息

from urllib.request import urlopen

resp = urlopen('http://www.baidu.com')

print (resp.getcode())

print (resp.geturl())

print (resp.info())

Python3使用urllib爬取简单页面

8、F5运行程序，打印出返回头部信息

Python3使用urllib爬取简单页面

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。

相关推荐

win10更新后无法上网解决方法

阅读量：170

怎么设置下载速度

阅读量：67

显卡怎么拆下来

阅读量：50

Windows11如何设置新网络

阅读量：142

win10无法访问internet

阅读量：116

猜你喜欢

猜你喜欢