java 使用Jsoup提取HTML纯文本

电玩女神 2022-04-23 12:40 453阅读 0赞

java 使用Jsoup提取HTML纯文本

网上很多提取HTML文本的方法,但是都不全,很多的特殊字符不能过滤掉,本文章讲述的方法可以将所有的标签包括HTML的特殊字符全部过滤掉。

  1. 使用maven导入Jsoup包

    1. <dependency>
    2. <groupId>org.jsoup</groupId>
    3. <artifactId>jsoup</artifactId>
    4. <version>1.8.1</version>
    5. </dependency>
  2. 使用方法

    String html = “

    \r\n\t尊敬的用户, 您好!\r\n

    “;
    String text = Jsoup.parse(html).text()

发表评论

表情:
评论列表 (有 0 条评论,453人围观)

还没有评论,来说两句吧...

相关阅读