Python正则表达式实现提取数据功能
1、用import 代码导入相关模块,这里我们导入urllib模块和re模块,具体代码如下:
import urllib.request
import re

2、建立一个变量,名称为url,把想要获取数据的网址赋值给这个url,代码如图所示。
这里我们获取到的是疫情的一个数据。

3、接下来我们向这个url发送请求,具体代码为:
res = urllib.request.urlopen(url)

4、然后我们获取网页数据,具体代码为:date = res.read().decode("utf8")
因为网站是utf8编码格式,所以这里我们加入了编码的参数

5、接下来我们开始写正则表达式的规则部分,具体代码如下:
pattern = re.compile(r'Count":\d{5},"')

6、继续完善正则部分的代码:res = re.findall(pattern,date)
经过以上的处理,我们用print 打印结果:print(res[0])

7、整体代码总结和运行效果:
import urllib.request
import re
url = "https://ncov.dxy.cn/ncovh5/view/pneumonia"
res = urllib.request.urlopen(url)
date = res.read().decode("utf8")
pattern = re.compile(r'Count":\d{5},"')
res = re.findall(pattern,date)
print(res[0])

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:22
阅读量:78
阅读量:130
阅读量:135
阅读量:138