python3如何获取a标签href属性值
1、先介绍第一种,通过正则匹配a标签下面的href属性
先写一个标准的html,如下图:
2、先用正则匹配的方式来识别
使用正则首先需要导入相关的包
import re
然后创建正则表达式
pattern = '<a.*?href="(.+)".*?>(.*?)</a>'
3、用re.search可以查找到第一个
用re.findall可以查找到所有的
4、还可以使用BeautifulSoup直接方便的省略掉正则表达式
用类库,需要自己先安装
安装之后导入即可
from bs4 import BeautifulSoup初始化soup = BeautifulSoup(html, 'html.parser')
可以查找到所有的a标签
soup.find_all('a')
5、找到所有的a标签,然后我们在从a标签中查找到href的值就可以了
使用for循环找出所有的a标签,href的值
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:140
阅读量:153
阅读量:103
阅读量:61
阅读量:187