第 9 节 正则表达式
问题引出
下面要求编写一个程序:判断一个字符串是否由数字所组成。
实现原理:
将字符串变为字符数组;
而后判断每一个字符是否在'0'~'9'的范围之间。
范例: 实现字符串的判断
package com.alpha;
public class MainClass{
public static void main(String[] args) throws Exception {
String str = "1234a56879";
System.out.println(isNumber(str));
}
public static boolean isNumber(String temp) {
char[] data = temp.toCharArray(); // 将字符串变为字符数,目的是循环取出
for (int i = 0; i < data.length; i ++) {
if (data[i] > '9' || data[i] < '0') {
return false;
}
}
return true;
}
}此时判断字符串是否由数字所组成,是一个很容易的实现的功能,但是这样一个简短的操作,却写出了这么多代码,如果说需要更加复杂的判断,这种方式显然就不再适用了。
范例: 更简单的做法
对于之前的判断这里只用了一个字符串就实现了,而其中的"\\d+"就是正则表达式。
正则是从JDK1.4的时候正式引入到Java中的工具类,所有正则支持类都定义在java.util.regex包里面。在JDK1.4之前,如果想要使用正则,则需要单独下载一个正则表达式的开发包后才可以使用。
在java.util.regex包里面定义了两个主要的类:
Pattern类:此类对象如果要想取得必须使用compile()方法,方法的功能是编译正则;
Matcher类:通过Pattern类取得。
常用的正则标记
所有的正则可以使用的标记都在java.util.Pattern类里面定义。
1、单个字符
x :表示由任意一位字符所组成;
\\:表示转义字符"\";
\t:表示制表符;
\n:表示换行符;
2、字符集
[abc]:表示字符abc中任意一个;
[^abc]:表示不是字符abc中任意一个;
[a-z]:表示任意一位小写字母;
[a-zA-Z]:表示任意一位字母;
[0-9]:表示任意的一位数字;
3、简化的字符集
. :表示任意一位字符;
\d:表示[0-9];
\D:表示[^0-9];
\s:表示任意的空白字符,"\t"、"\n";
\S:表示任意非空白字符;
\w:等价于[a-zA-Z_0-9],表示由任意的字母、数字、_所组成;
\W:等价于[^a-zA-Z_0-9],表示不是由任意的字母、数字、_所组成;
4、边界匹配
^ :正则的开始;
$ :正则的结束;
5、数量表达
X?:表示此正则可以出现0次或1次;
X+:表示此正则可以出现1次或1次以上;
X*:表示此正则可以出现0次1次或多次;
X{n}:表示此正则出现n次;
X{n,}:表示此正则至少出现n次;
X{n, m}:表示此正则出现(包含)n到m次;
6、逻辑运算
XY:正则X判断后再判断正则Y;
X|Y:满足正则X或正则Y;
(X):将多个正则设置为一组;
String类对正则的支持
在JDK1.4之后,由于正则的引入,所以String类里面也相应的增加了新的操作方法支持。
1
public boolean matches(String regex)
普通
正则验证,使用指定的字符串判断其是否符合给出的正则表达式
2
public String replaceAll(String regex, String replacement)
普通
全部替换
3
public String replaceFirst(String regex, String replacement)
普通
替换首个
4
public String[] split(String regex)
普通
全部拆分
5
public String[] split(String regex, int limit)
普通
部分拆分
给出的几个方法里面对于替换和拆分实际上难度不高,最关键的就是正则匹配,在验证上使用的特别多。
范例: 实现字符串替换
范例: 字符串拆分
范例: 验证一个字符串是否是数字,如果是则将其变为double型
数字可能是整数,也可能是小数;
范例: 判断给定的字符串是否是一个IP地址(IPv4)
范例: 给定一个字符串,要求判断其是否是日期格式,如果是则将其转换为Date型数据
范例: 判断电话号码
格式一:12345678,"\\d{7,8}";
格式二:029-12345678,"(\\d{3,4}-)?\\d{7,8}";
格式三:(029)-12345678,"((\\d{3,4}-)|(\\(\\d{3,4}\\)-))?\\d{7,8}"。
范例: 验证email地址
要求格式一:email由字幕、数字、_所组成。
要求格式二:用户名要求由字母、数字、_、.组成,其中必须以字母开头,以字母或数字结尾,长度不超过30,最后的根域名只能够是.com、.cn、.net、.com.cn、.edu、.gov、.org。
java.util.regex包支持
在大多数情况下使用正则的时候都会采用String类完成,但是正则最原始的开发包是java.util.regex,这个包里提供有两个类。
范例: Pattern类
范例: 字符串验证
正是因为String类本身就已经支持这样两种操作了,所以很少再去利用这两个类进行操作。
总结
利用正则实现验证代码可以最少化;
一定要清楚String类对正则支持的几个方法,以及所有讲解过的相关程序。
最后更新于
这有帮助吗?