jsoup(jsoup爬取动态网页)
利用Jsoup如何获取具体标签属性值?
doc.select(“meta[name=description]“),get(0).attr(“content”)
大致是这么写的,自你可以研究一下2113JSOUP的选择器,
chenying99/archive/2013/01/04/2844615,html” target=”_blank”>
要取得一个属性的值,可以使用5261Node.attr(String key) 方法4102
对于一个元素中的1653文本,可以使用Element.text()方法
对于要取得元素或属性中的HTML内容,可以使用Element.html(),或 Node.outerHtml()方法。
httpclient和jsoup的区别
应该是httpClient抓取更牛逼吧,属于专业的抓取网页的库,可以设置代理,抓取失败可以重试抓取之类的
在抓取上jsoup比较弱,API简单,所以功能也简单么,主要是扩展htmlparser的功能吧,解析html。。
搜一下:httpclient和jsoup的区别
还没有评论,来说两句吧...