Python正则表达式学习笔记 - 海筒研习社.SeaSilo.CN

/ 0评 / 0

正则表达式

​ 对文本内容的搜索,定位,提取是逻辑比较复杂的工作。

定义:
文本的高度匹配模式,其本质是由一系列字符和特殊符号构成号构成的字串,这个字串即正则表达式。

原理:
通过普通字符和有特殊含义的字符,来组成字符串,用以描述一定的字符串规则,比如:重复,位置等,来表达某类特定的字符串,进而匹配。

目标:
1. 熟练掌握元字符
2. 能够读懂常用正则表达式,编辑正则规则
3. 熟练使用re模块操作正则表达式

1. 单字匹配

Python re模块使用

——————————————————————————

1. 基础函数

以下为Python正则表达式常用函数:

re.findall(pattern,string) 
功能:根据正则表达式匹配目标字符串内容 
参数:pattern 正则表达式 
     string 目标字符串 
返回值: 匹配到的内容列表,如果正则表达式有子组则只能获得到子组对应的内容 

re.split(pattern,string,max) 
功能:使用正则表达式匹配内容,切割目标字符串 
参数:pattern 正则表达式 
     string 目标字符串 
     max 最多切割几部分 
返回值:切割后的内容列表 

re.sub(pattern,replace,string,count) 
功能:使用一个字符串替换正则表达匹配到的内容 
参数: pattern 正则表达式 
      replace 替换的字符串 
      string 目标的字符串 
      count 最多替换几处,默认替换全部 
返回值:替换后的字符串

2. 生成match对象

re.finditer(pattern,string)
功能:根据正则表达式匹配目标字符串内容
参数:pattern 正则表达式
     string 目标字符串
返回值:匹配结果的迭代器
re.match(pattern,string)
功能:匹配某个目标字符串开始位置
参数:pattern 正则
     string 目标字符串
返回值:匹配内容match object
re.search(pattern,string)
功能:匹配目标字符串第一个符合内容
参数:pattern 正则
     string 目标字符串
返回值:匹配内容match object

3. match对象使用

span() 
   功能:获取匹配内容的起止位置
group(n = 0)
   功能:获取match对象匹配内容参数:默认为0表示获取整个match对象内容,如果是序列号或者组名则表示获取对应子组内容返回值:匹配字符串
img

发表评论

邮箱地址不会被公开。 必填项已用*标注