python爬虫BeautifulSoup的简单使用

2026-01-14 00:17:50

1、点击开始--运行，输入cmd命令，打开windows命令行窗口

python爬虫BeautifulSoup的简单使用

2、使用pip安装BeautifulSoup包

pip install BS4

python爬虫BeautifulSoup的简单使用

3、打开python开发工具IDLE，新建‘bstest.py’文件，并代码如下：

from bs4 import BeautifulSoup

import urllib.request

s = urllib.request.urlopen('http://www.baidu.com')

print (type(s.read()))

python爬虫BeautifulSoup的简单使用

4、F5运行代码，打印出返回结果类型，为bytes

python爬虫BeautifulSoup的简单使用

5、修改代码，将响应传入创建一个BeautifulSoup对象，这样就可以解析了，注意不要使用read方法，代码如下：

from bs4 import BeautifulSoup

import urllib.request

s = urllib.request.urlopen('http://www.baidu.com')

so = BeautifulSoup(s,'html.parser')

python爬虫BeautifulSoup的简单使用

6、使用创建的BeautifulSoup对象打印网页的title，代码如下：

from bs4 import BeautifulSoup

import urllib.request

s = urllib.request.urlopen('http://www.baidu.com')

so = BeautifulSoup(s,'html.parser')

print (so.title)

python爬虫BeautifulSoup的简单使用

7、F5运行代码打印出网页的title，正确解码成中文，这就是beautifulsoup的魅力

python爬虫BeautifulSoup的简单使用

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。

相关推荐

如何设置el-pagination设置上一页箭头为文字

阅读量：24

如何遍历Map集合

阅读量：144

C# 判断IP是否正确合法并给出提示

阅读量：182

有道云笔记1.5正式版基本操作方法

阅读量：75

如何正确分析网站

阅读量：62

猜你喜欢

猜你喜欢