jsoup(jsoup爬取动态网页)

阳光穿透心脏的1/2处 2023-09-26 14:42 193阅读 0赞

利用Jsoup如何获取具体标签属性值?

doc.select(“meta[name=description]“),get(0).attr(“content”)

大致是这么写的,自你可以研究一下2113JSOUP的选择器,

chenying99/archive/2013/01/04/2844615,html” target=”_blank”>

要取得一个属性的值,可以使用5261Node.attr(String key) 方法4102

对于一个元素中的1653文本,可以使用Element.text()方法

对于要取得元素或属性中的HTML内容,可以使用Element.html(),或 Node.outerHtml()方法。

jsoup(jsoup爬取动态网页)\_jsoup(jsoup爬取动态网页)

httpclient和jsoup的区别

应该是httpClient抓取更牛逼吧,属于专业的抓取网页的库,可以设置代理,抓取失败可以重试抓取之类的

在抓取上jsoup比较弱,API简单,所以功能也简单么,主要是扩展htmlparser的功能吧,解析html。。

搜一下:httpclient和jsoup的区别

发表评论

表情:
评论列表 (有 0 条评论,193人围观)

还没有评论,来说两句吧...

相关阅读