您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

Java正则表达式如何使用

2025/10/15 16:07:57发布13次查看
1.什么是正则表达式在了解正则表达式之前,我们先看几个非常常见的问题:
如何判断字符串是否是有效的电话号码?例如:010-1234567,123abc456,13510001000等;
如何判断字符串是否是有效的电子邮件地址?例如:test@example.com,test#example等;
如何判断字符串是否是有效的时间?例如:12:34,09:60,99:99等。
一种直观的想法是通过程序判断,这种方法需要为每种用例创建规则,然后用代码实现。
为每一种判断逻辑编写代码实在是太繁琐了。有没有更简单的方法?
有!用正则表达式!
正则表达式可以用字符串来描述规则,并用来匹配字符串。例如,判断手机号,我们用正则表达式\d{11}
使用正则表达式的好处有哪些?一个正则表达式就是一个描述规则的字符串,所以,只需要编写正确的规则,我们就可以让正则表达式引擎去判断目标字符串是否符合规则。
正则表达式是一套标准,它可以用于任何语言。java标准库的java.util.regex包内置了正则表达式引擎,在java程序中使用正则表达式非常简单。
2.快速入门案例找到文本中的所有英文单词(含字母):
import java.util.regex.matcher;import java.util.regex.pattern;/** * 正则表达式快速入门 */public class helloregularexpression { public static void main(string[] args) { string content = "go的语法接近c语言,但对于变量的声明有所不同。go支持垃圾回收功能" + "。go的并行模型是以东尼·霍尔的通信顺序进程(csp)为基础,采取类似模型的" + "其他语言包括occam和limbo,但它也具有pi运算的特征,比如通道传输。在" + "1.8版本中开放插件(plugin)的支持,这意味着现在能从go中动态加载部分" + "函数。\n" + "与c++相比,go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" + "能,但增加了 切片(slice) 型、并发、管道、垃圾回收、接口" + "(interface)等特性的语言级支持。go 2.0版本将支持泛型,对于断言的" + "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" + "不同于java,go内嵌了关联数组(也称为哈希表(hashes)或字典" + "(dictionaries) ),就像字符串类型一样。"; // 实例:找到文本中的所有英文单词(含字母) // 先创建一个pattern模式对象 pattern pattern = pattern.compile("[a-za-z]+"); // 创建一个匹配器对象 matcher matcher = pattern.matcher(content); // 开始匹配 while (matcher.find()) { system.out.println("找到:" + matcher.group(0)); } }}
输出:
找到:go
找到:c
找到:go
找到:go
找到:csp
找到:occam
找到:limbo
找到:pi
找到:plugin
找到:go
找到:c
找到:go
找到:slice
找到:interface
找到:go
找到:java
找到:go
找到:hashes
找到:dictionaries
3.正则表达式语法转义符号当我们在检索某些字符时,需要用到转义符号,否则检索不到结果,甚至发生错误
在正则表达式中,两个\\代表其他语言中的一个\
字符匹配符[] - 可接受的字符列表
[efgh] 表示可接收的efgh中的任意一个字符
[^] - 不可接受的字符列表
^abc 表示除了abc之外的任意一个字符,包括数字和特殊字符
- - 连字符
a-z 表示任意一个大写字母
. - 匹配除\n以外的任意一个字符
a..b 以a开头,b结尾,中间包括2个任意字符的长度为4的字符串
\\d - 匹配单个数字字符
\\d{3}(\\d)? 包含3个或者4个数字的字符串
\\d 匹配单个非数字字符
\\d(\\d)* 以单个非数字字符开头,后接任意个数字字符串
\\w 匹配单个数字、大小写字符
\\d{3}\\w{4} 以三个数字字符开头的长度为7的数字字母字符串
\\w 匹配非数字字母字符串
\\w+\\d{2} 以至少一个非数字字母字符开头,2个数字字符结尾的字符串
字符匹配符演示import java.util.regex.matcher;import java.util.regex.pattern;/** * 正则表达式快速入门 */public class helloregularexpression { public static void main(string[] args) { string content = "go的语法接近c语言,但对于变量的声明有所不同。go支持垃圾回收功能" + "。go的并行模型是以东尼·霍尔的通信顺序进程(csp)为基础,采取类似模型的" + "其他语言包括occam和limbo,但它也具有pi运算的特征,比如通道传输。在" + "1.8版本中开放插件(plugin)的支持,这意味着现在能从go中动态加载部分" + "函数。\n" + "与c++相比,go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" + "能,但增加了 切片(slice) 型、并发、管道、垃圾回收、接口" + "(interface)等特性的语言级支持。go 2.0版本将支持泛型,对于断言的" + "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" + "不同于java,go内嵌了关联数组(也称为哈希表(hashes)或字典" + "(dictionaries) ),就像字符串类型一样。a11c8abcabcabc"; // 实例:找到文本中的所有英文单词(含字母) // 先创建一个pattern模式对象 pattern pattern = pattern.compile("[a-za-z]+"); // 创建一个匹配器对象 matcher matcher = pattern.matcher(content); // 开始匹配 while (matcher.find()) { system.out.println("找到:" + matcher.group(0)); } // 实例:找到a-z之间的任意一个字符 pattern pattern1 = pattern.compile("[a-z]"); matcher matcher1 = pattern1.matcher(content); while (matcher1.find()) { system.out.println("2找到:" + matcher1.group(0)); } // 实例:找到abc字符,不区分大小写 pattern pattern2 = pattern.compile("(?i)abc"); matcher matcher2 = pattern2.matcher(content); while (matcher2.find()) { system.out.println("3找到:" + matcher2.group(0)); } // 实例:找到abc字符,b不区分大小写 pattern pattern3 = pattern.compile("a((?i)b)c"); matcher matcher3 = pattern3.matcher(content); while (matcher3.find()) { system.out.println("4找到:" + matcher3.group(0)); } // 实例:找到abc字符,不区分大小写,设置参数的方式 pattern pattern4 = pattern.compile("abc", pattern.case_insensitive); matcher matcher4 = pattern4.matcher(content); while (matcher4.find()) { system.out.println("5找到:" + matcher4.group(0)); } // 实例:找到非数字字母字符的所有字符(含中文) pattern pattern5 = pattern.compile("\\w", pattern.case_insensitive); matcher matcher5 = pattern5.matcher(content); while (matcher5.find()) { system.out.println("6找到:" + matcher5.group(0)); } }}
选择匹配符| - 多个条件满足一个即可匹配成功
例如:匹配文本中的go/c/java中的任意一个字符串
string content = "go的语法接近c语言,但对于变量的声明有所不同。go支持垃圾回收功能" + "。go的并行模型是以东尼·霍尔的通信顺序进程(csp)为基础,采取类似模型的" + "其他语言包括occam和limbo,但它也具有pi运算的特征,比如通道传输。在" + "1.8版本中开放插件(plugin)的支持,这意味着现在能从go中动态加载部分" + "函数。\n" + "与c++相比,go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" + "能,但增加了 切片(slice) 型、并发、管道、垃圾回收、接口" + "(interface)等特性的语言级支持。go 2.0版本将支持泛型,对于断言的" + "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" + "不同于java,go内嵌了关联数组(也称为哈希表(hashes)或字典" + "(dictionaries) ),就像字符串类型一样。a11c8abcabcabc";pattern pattern = pattern.compile("go|c|java");matcher matcher = pattern.matcher(content);while (matcher.find()) { system.out.println("找到:" + matcher.group(0));}
正则限定符* - 指定字符重复0次或n次
示例:(abc)* 指定abc字符串重复0次或者n次
实例:abc,abcabcabc
+ - 指定字符重复1次或n次
示例:m+(abc)* 指定以至少一个m开头,后面接任意个abc的字符串
实例:m,mabc,mmabcabc
? - 指定字符重复0次或者1次
示例:m+abc? 指定以至少一个m开头,后面是ab或者abc的字符串
实例:mab,mmabc
{n} - 只能输入n个字符
示例:[abcd]{3} 由abcd字符组成的任意长度为3的字符串
实例:abc,dbc,adc
{n,} - 指定至少n个匹配
示例:[abcd]{3,} 由abcd组成的任意长度不小于3的字符串
实例:aab,aaadbc
{n,m} - 指定至少n个但是不多于m个匹配
注意:java的匹配是贪婪匹配,即尽可能匹配多的,即优先匹配m个字符
示例:[abcd]{3,5} 由abcd组成的任意长度不小于3大于5的字符串
实例:abc,aaabb
代码演示:(匹配六个a)
import java.util.regex.matcher;import java.util.regex.pattern;/** * 正则限定符 */public class qualifier { public static void main(string[] args) { string content = "go的语法接近c语言,但对于变量的声明有所不同。go支持垃圾回收功能" + "。go的并行模型是以东尼·霍尔的通信顺序进程(csp)为基础,采取类似模型的" + "其他语言包括occam和limbo,但它也具有pi运算的特征,比如通道传输。在" + "1.8版本中开放插件(plugin)的支持,这意味着现在能从go中动态加载部分" + "函数。\n" + "与c++相比,go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" + "能,但增加了 切片(slice) 型、并发、管道、垃圾回收、接口" + "(interface)等特性的语言级支持。go 2.0版本将支持泛型,对于断言的" + "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" + "不同于java,go内嵌了关联数组(也称为哈希表(hashes)或字典" + "(dictionaries) ),就像字符串类型一样。aaaaaa11c8abcabcabc"; // 匹配六个a pattern pattern = pattern.compile("a{6}"); matcher matcher = pattern.matcher(content); while (matcher.find()) { system.out.println("找到:" + matcher.group(0)); } }}
正则定位符^ - 指定起始字符
示例:^[0-9]+[a-z]* 以至少1个数字开头,后接任意个小写字母的字符串
实例:123,6aa,555edf
$ - 指定结束字符
示例:^[0-9]\\-[a-z]+$ 以至少一个数字开头连接-并以至少一个小写字母结尾的字符串
实例:1-a,2-abc
程序演示:
pattern pattern = pattern.compile("^[0-9]+[a-z]*");matcher matcher = pattern.matcher("123abc");while (matcher.find()) { system.out.println("找到:" + matcher.group(0));}pattern pattern2 = pattern.compile("^[0-9]\\-[a-z]+$");matcher matcher2 = pattern2.matcher("1-a");while (matcher2.find()) { system.out.println("找到:" + matcher2.group(0));}
输出:
找到:123abc
找到:1-a
\\b   - 匹配目标字符串的边界(结尾)
示例:guo\\b 字串间有空格,或者是目标字符串的结尾位置匹配guo
实例:yunyunguo nanguo
\\b   - 匹配目标字符串的边界(开头)
示例:guo\\b 字串间有空格,或者是目标字符串的开头位置匹配guo
实例:guoyunyun guotime
以上就是java正则表达式如何使用的详细内容。
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product