常用正则表达式
1、所有html标签内容
查找所有html标签内容(<...>):<(\S*?)[^>]*>.*?|<.*? />
这样可以一次替换掉所有html标签内容
2、某字符开头的html标签内容
查找以p开头的html标签内容(
):<(p\S*?)[^>]*>.*?|<.*? />
3、开头不含某字符html标签内容
查找不以i开头标签内容():<([^i]\S*?)[^>]*>.*?|<.*? />
这样可以把img(图片)以外的标签全部替换掉,使用得文档只保留无格式文本及图片
4、汉字、字母、数字及空格表达式
汉字正则表达式: [\u4e00-\u9fa5]
字母正则表达式: [a-zA-Z]
数字正则表达式: [0-9]
空格正则表达式: \s
5、删除特殊位置的空格
删除汉字间的空格:([\u4e00-\u9fa5])\s+([\u4e00-\u9fa5]) 替换为 $1$2
字母与汉字间的空格:([a-zA-Z])\s+([\u4e00-\u9fa5]) 替换为 $1$2
汉字与字母间的空格:([\u4e00-\u9fa5])\s+([a-zA-Z]) 替换为 $1$2
数字与汉字间的空格:([0-9])\s+([\u4e00-\u9fa5]) 替换为 $1$2
汉字与数字间的空格:([\u4e00-\u9fa5])\s+([0-9]) 替换为 $1$2
6、插入字符
汉字与数字间增加一个字符(如s):([\u4e00-\u9fa5])([0-9]) 替换为 $1\s$2
FALSE
常用正则表达式