[原创]java开发中的正则表达式的使用_Android, Python及开发编程讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Android, Python及开发编程讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 2309 | 回复: 0   主题: [原创]java开发中的正则表达式的使用        下一篇 
panpan.nie
注册用户
等级:大校
经验:4754
发帖:217
精华:2
注册:1970-1-1
状态:离线
发送短消息息给panpan.nie 加好友    发送短消息息给panpan.nie 发消息
发表于: IP:您无权察看 2015-9-18 18:11:33 | [全部帖] [楼主帖] 楼主

首先提一下常用的正则表达式的意思

.  任意字符

*  0个及0个以上

+  1个以上

^  一行开始

$  一行结束

[] 可选字符

[a-z] 包含所有字母

[^abc] 不包含字母a,字母b,字母c

(abc) 匹配abc字符串


对于字段html代码,如

<P style="text-align: right;">abc<span style="font-size: 16px;">ab</span></p><p><span style="font-size: 16px;">--转自</span><img src="http://bbs.landingbj.com/images/google.jpg" alt="北京联动北方科技有限公司"><br></p><p>测试</p>
如果我要匹配所有p标签,我可以使用:<p[^>]*> 
匹配<p[^>]*>的结果:
<P style="text-align: right;">
<p>
<p>

如果我要匹配所有p标签的内容,可以使用 <p.*?</p>  ,说明一下.* 是指匹配任意长度的任意字符,加上? 组成的.*? 就是懒惰模式,只匹配满足条件的最短字符串

匹配<p.*?</p>的结果: <P style="text-align: right;">abc<span style="font-size: 16px;">ab</span></p> <p><span style="font-size: 16px;">--转自</span><img src="http://bbs.landingbj.com/images/google.jpg" alt="北京联动北方科技有限公司"><br></p> <p>测试</p>
而 <p.*</p>  则就是贪婪模式,会匹配最长的满足条件的字符串
匹配<p.*</p>的结果: <P style="text-align: right;">abc<span style="font-size: 16px;">ab</span></p><p><span style="font-size: 16px;">--转自</span><img src="http://bbs.landingbj.com/images/google.jpg" alt="北京联动北方科技有限公司"><br></p><p>测试</p>
若是我想要匹配包含 "--转自" 的那一个段落的数据,可以使用<p((?!</p>).)*--转自.*?</p>  
说明一下,该正则表达式的含义是匹配一个以<p开始  不包含字符串</p> 包含 关键字符"--转自" 并且以</p> 结尾的字符串。
不包含字符串</p> 可以写成 ((?!</p>)
匹配<p((?!</p>).)*--转自.*?</p>的结果: <p><span style="font-size: 16px;">--转自</span><img src="http://bbs.landingbj.com/images/google.jpg" alt="北京联动北方科技有限公司"><br></p>

用Java代码测试

package cn.js.fan.security; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test {     public String notices;          public static void main(String[] args)     {         String content = "<P style=\"text-align: right;\">abc<span style=\"font-size: 16px;\">ab</span></p><p><span style=\"font-size: 16px;\">--转自</span><img src=\"http://bbs.landingbj.com/images/google.jpg\" alt=\"北京联动北方科技有限公司\"><br></p><p>测试</p>";         System.out.println(content);         String[] regexs={"<p[^>]*>","<p.*</p>","<p.*?</p>","<p((?!</p>).)*--转自.*?</p>"};         for(String regex:regexs)         {             Matcher m=Pattern.compile(regex,Pattern.DOTALL|Pattern.CASE_INSENSITIVE).matcher(content);             System.out.println("匹配"+ regex +"的结果:");             while(m.find()){                  String data=m.group();                 System.out.println(data);             }             System.out.println();         }     } }

关于不包含字符串的参考:正则表达式里字符串”不包含”匹配技巧







赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论