Python教程:[34]根据网址采集网页
做数据分析的工作,大部分时间不是在处理数据而是在收集数据,使用python可以手机网页数据,今天我们就教给大家如何使用python的urllib2来获取网页源码,这是最简单的获取网页源码的方法,以后我们会逐步加大难度。
引入模块urllib2
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/a44e8afc508c9bce8e275bc3d6dd884ce44afa77.jpg)
设置要采集的地址
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/e40b3127e7ef28063ade4369b840b6f39087f277.jpg)
使用urlopen方法来返回网页文件
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/9881b1fce186242ff3ad45ab35e434daf15ee877.jpg)
只能使用read方法来获得网页文件的内容
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/ff5c88d818196120c112ddda70f202b374d7df77.jpg)
看一下f的长度就知道是否真的返回了网页
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/bab5c45872dade4911d05ae226042e6816e9d577.jpg)
避免这样去看f的内容,你会疯掉的。
![Python教程:[34]根据网址采集网页](https://exp-picture.cdn.bcebos.com/0fb94656d53da824a2361d66306651598440cb77.jpg)
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:134
阅读量:44
阅读量:133
阅读量:136
阅读量:120