Java字符串替换 replaceAll 使用解析

迈不过友情╰ 2024-04-02 03:15 146阅读 0赞

从 Dangling meta character 的错误开始

有一个字符串。 里面包含符号加号(+), 现在使用replaceAll() 方法将所有的加号替换为下划线 (_), 示例代码如下:

  1. String str = "+";
  2. String newStr = str.replaceAll("+", "_");

执行之后报如下错误:

  1. java.util.regex.PatternSyntaxException: Dangling meta character '+' near index 0
  2. +
  3. ^
  4. at java.util.regex.Pattern.error(Pattern.java:1955)
  5. at java.util.regex.Pattern.sequence(Pattern.java:2123)
  6. at java.util.regex.Pattern.expr(Pattern.java:1996)
  7. at java.util.regex.Pattern.compile(Pattern.java:1696)
  8. at java.util.regex.Pattern.<init>(Pattern.java:1351)
  9. at java.util.regex.Pattern.compile(Pattern.java:1028)
  10. at java.lang.String.replaceAll(String.java:2223)

为什么会出现这个错误呢? Dangling meta character 翻译一下是悬空元字符, 也就是说符号加号属于悬空元字符。 为什么呢?
看一下String 对象类的 replaceAll() 开始, 这个方法的定义如下:

  1. public String replaceAll(String regex, String replacement) {
  2. return Pattern.compile(regex).matcher(this).replaceAll(replacement);
  3. }

也就是说: replaceAll() 使用的是正则表达式进行替换, 而在正则表达式中, 加号用来表示匹配的次数, 在正则表达式中有特别的意义。

除了+ 之外, 在正则表达式中有特殊意义的字符还有: * , | , \ 等。

如何解决

对于这类特殊字符, 解决的方法肯定就是转义了, 怎么转义呢? 有两种方法:

  1. 使用两个反斜线 \\
    为什么是两个, 转义一般不是一个反斜线就可以了吗? 因为 反斜线本身就是特殊字符, 对反斜线转义之后得到真正的反斜线。所以, 示例代码如下:

    newStr = str.replaceAll(“\+”, “_”);

    1. Assertions.assertTrue(newStr.equals("_"));
  2. 使用中括号

    String str = “+”;

    1. String newStr = str.replaceAll("[+]", "_");
    2. Assertions.assertTrue(newStr.equals("_"));

中括号的方式容易理解, 反斜线的方式在其他语言和场景中也经常使用, 使用哪种?可以根据情况选择, 在同一个应用中保持一致即可。

发表评论

表情:
评论列表 (有 0 条评论,146人围观)

还没有评论,来说两句吧...

相关阅读