Python正则表达式实现提取数据功能

2025-10-25 18:27:00

1、用import 代码导入相关模块,这里我们导入urllib模块和re模块,具体代码如下:

import  urllib.request


import re

Python正则表达式实现提取数据功能

2、建立一个变量,名称为url,把想要获取数据的网址赋值给这个url,代码如图所示。

这里我们获取到的是疫情的一个数据。

Python正则表达式实现提取数据功能

3、接下来我们向这个url发送请求,具体代码为:

res = urllib.request.urlopen(url)  

Python正则表达式实现提取数据功能

4、然后我们获取网页数据,具体代码为:date = res.read().decode("utf8")

因为网站是utf8编码格式,所以这里我们加入了编码的参数

Python正则表达式实现提取数据功能

5、接下来我们开始写正则表达式的规则部分,具体代码如下:

pattern = re.compile(r'Count":\d{5},"')

Python正则表达式实现提取数据功能

6、继续完善正则部分的代码:res = re.findall(pattern,date)

经过以上的处理,我们用print 打印结果:print(res[0])

Python正则表达式实现提取数据功能

7、整体代码总结和运行效果:

import  urllib.request


import re
url = "https://ncov.dxy.cn/ncovh5/view/pneumonia"
res = urllib.request.urlopen(url)
date = res.read().decode("utf8")
pattern = re.compile(r'Count":\d{5},"')
res = re.findall(pattern,date)
print(res[0])

Python正则表达式实现提取数据功能

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢