Python:如何利用正则表达式统计词频?
1、打开PyCharm软件,创建一个Python文件,并准备一份有内容的文本文件。

2、引入re模块。

3、写上打开与关闭文件的代码。

4、统计单个英文字母出现的频率。
1、f.read()函数读取文件全部内容;
2、re.findall('i', f.read())获取文件中出现的i;
3、len()函数统计列表元素个数。

5、统计单个中文单词出现的频率,除了需要重新处理下文件偏移量外,其他步骤与第四步完全一致。

6、统计数字出现的频率(与第五步一致)。

7、统计英文字母出现的频率(与第五步一致)。

8、统计有多少个标点符号(与第五步一致)。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:28
阅读量:103
阅读量:51
阅读量:137
阅读量:91