pandas教程:[17]字符串提取数据
很多时候数据都是以字符串的形式保存的,比如多选题的答案,很多人都是用‘ABCD’这种形式保存数据,那么我们怎样将这样的数据提取出来,转换成可以统计的数据呢?pandas的extract可以做到这些。
先来创建一个数据序列
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/e4b5e2f5ee0d3ace7dbf76df87e265e7350fbbfc.jpg)
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/9b2098254193cee8586c50af5a0ff2260c9aa8fc.jpg)
使用extract方法提取数字:它的第一个参数是正则表达式,括号表示要提取的部分
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/c255efc595ee41c1404fa8e78d88912ca4ca9bfc.jpg)
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/5e615d715fdb3620bc53c93dabc5260f89358dfc.jpg)
假如我们要提取多个数据,可以使用多个括号
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/89402670d5413a8cb761a1bb1ffc508c9ace81fc.jpg)
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/95bd4e8c9bcec7f89d1e5969034ce54a2e27fbfc.jpg)
你要灵活使用问号,它表示可有可无,下面的方式可以匹配字符“c”
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/6a408cdd3340b6f3b3ee07a812c0affce086eefc.jpg)
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/979906196120a7cd3807ff4689b375d7987bdcfc.jpg)
如果我们想要让输出的结果包含变量名(列名),我们可以使用下面的写法:
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/d9a8d2d2bb665159ce29149e8fe23ea23b42c7fc.jpg)
![pandas教程:[17]字符串提取数据](https://exp-picture.cdn.bcebos.com/0d55dc7bd2828689fa2fb30565f97fbd4d7c37fd.jpg)
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:166
阅读量:147
阅读量:189
阅读量:89
阅读量:194