[转帖] JDK 正则表达式_Android, Python及开发编程讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Android, Python及开发编程讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 2815 | 回复: 0   主题: [转帖] JDK 正则表达式        下一篇 
    本主题由 koei 于 2014-5-2 16:21:52 移动
happy
注册用户
等级:上尉
经验:681
发帖:38
精华:0
注册:2013-4-22
状态:离线
发送短消息息给happy 加好友    发送短消息息给happy 发消息
发表于: IP:您无权察看 2013-4-24 14:14:19 | [全部帖] [楼主帖] 楼主

一、正则表达式的编译形式

1)指定为字符串的正则表达式必须首先被编译为此类的实例。compile

2)将得到的模式用于创建Matcher对象。matcher

3)依照正则表达式,该对象可以于任意字符序列匹配。matches

例:

package regexp;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
      public static void main(String[] args) {
            test1();
      }
      public static void test1() {
            Pattern p = Pattern.compile(a*b);
            Matcher m = p.matcher(aaaaab);
            boolean b = m.matches();
            System.out.println(b);
      }
}


二、规则

1)字符类

. 表示任何字符

[abc] 包含a、b、c的任何字符 (和a|b|c相同)

[^abc] 除a、b、c之外的任何字符 (否定)

[a-zA-Z] 任何从a到z或从A到Z的字符 (范围)

[abc[hij]] 任意a、b、c、h、i、j字符 (与a|b|c|h|i|j相同)(合并)

[a-z&&[hij]] 任意h、i、j字符 (交)

\s whitespace符 (空格、tab、换行、换页、回车)

\S 非whitespace符 ([^\s])

\d 数字[0-9]

\D 非数字[^0-9]

\w word character ([a-zA-Z_[0-9])


\W 非word character (^\w)

2)在Java中,“\\”意味着正在插入一个正则表达式的反斜杠,随后的字符具有特殊意义。

XY XY


X|Y X或Y

(X) Capturing group


3)边界匹配

^ 一行的开始

$ 一行的结束

\b 词界

\B 非词界

\G 上一级的结尾

4)量词

? 0或1个

* 0或多个

+ 1或多个

X{n} X,恰好n次

X{n,} X,至少n次

X{n,m} X,至少n次,至多m次

三、字符序列

CharSequence接口,从String到StringBuffer类中抽象出。

interface CharSequence{
      charAt(int i); //返回指定索引处的char值
      length(); //返回长度
      subSequence(int start,int end); //返回从索引start开始,end结束的子序列
      toString(); //返回字符串
}


四、在Java中,正则表达式是通过java.util.regex包里面的Pattern和Matcher类来实现的。

1)Matcher.find()用于发现应用于CharSequence的多重模式匹配。

2)find(int start) 重置此匹配器,然后尝试查找匹配该模式、从指定索引开始的输入序列的下一个子序列。

例:

package myfile;
import java.util.regex.*;
import java.util.*;
public class FindDemo {
      private static String str=boolean contains(CharSequence s) new Test();
      public static void main(String[] args) {
            Matcher m=Pattern.compile(\\w+).matcher(Evening is full of the linnets wings);
            while(m.find())
            System.out.println(m.group());
            int i=0;
            while(m.find(i)){
                  i++;
                  System.out.print(m.group()+ );
            }
            System.out.println(\n+i=+i);
      }
}


一、组group

1、组是由圆括号分开的正则表达式,随后可以根据它们的组号进行调用。

第0组匹配整个表达式,第1组匹配第1个圆括号扩起来的组,......依次类推。

如:A(B(C))D

有3个组:

第0组:ABCD

第1组:BC

第2组:C

例子:

package myfile;
import java.util.regex.*;
public class GroupR2 {
      public static void main(String[] args) {
            String[] input=new String[]{
                  Java has regular expressions in 1.4,
                  regular expressions now expressing in Java,
                  Java represses oracular expressions
            };
            Pattern
            p1=Pattern.compile(re\\w*),
            p2=Pattern.compile(Java.*);
            for(int i=0;i


该贴由koei转至本版2014-5-2 16:21:52



赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论