精品学习网->精美文摘

上一篇    全部文章


      常用正则表达式

      1、所有html标签内容
      查找所有html标签内容(<...>):<(\S*?)[^>]*>.*?|<.*?    />
      这样可以一次替换掉所有html标签内容

      2、某字符开头的html标签内容    
      查找以p开头的html标签内容():<(p\S*?)[^>]*>.*?|<.*?    />

      3、开头不含某字符html标签内容
      查找不以i开头标签内容():<([^i]\S*?)[^>]*>.*?|<.*?    />
      这样可以把img(图片)以外的标签全部替换掉,使用得文档只保留无格式文本及图片

      4、汉字、字母、数字及空格表达式
      汉字正则表达式:    [\u4e00-\u9fa5]
      字母正则表达式:    [a-zA-Z]
      数字正则表达式:    [0-9]
      空格正则表达式:    \s

      5、删除特殊位置的空格  
      删除汉字间的空格:([\u4e00-\u9fa5])\s+([\u4e00-\u9fa5])  替换为  $1$2
      字母与汉字间的空格:([a-zA-Z])\s+([\u4e00-\u9fa5])  替换为  $1$2
      汉字与字母间的空格:([\u4e00-\u9fa5])\s+([a-zA-Z])  替换为  $1$2
      数字与汉字间的空格:([0-9])\s+([\u4e00-\u9fa5])  替换为  $1$2
      汉字与数字间的空格:([\u4e00-\u9fa5])\s+([0-9])  替换为  $1$2

      6、插入字符
      汉字与数字间增加一个字符(如s):([\u4e00-\u9fa5])([0-9])    替换为  $1\s$2




FALSE

     返回顶部
常用正则表达式