使用xpath获取标签下所有文本值（包括子标签的值）-蒲公英云

使用xpath获取标签下所有文本值（包括子标签的值）

最近在使用xpath提取信息时，由于所提取页面的数据标签比较凌乱，我只想要获取页面所显示的文本信息，因此通过查询相关资料，总结出如下方法：

1.获取文本值及所有html标签

html_content3 = requests.get(details_url).text
    html = etree.HTML(html_content3)
    # content=html.xpath('//div[@class="article-entry"]')[0].xpath('string(.)').strip()#得到其中的所有文本信息，但没有了标签属性。
    # 先取出包含文章主体的标签
    contents = html.xpath('//div[@class="article-entry"]')[0]
    # 取出来的是个element对象，需要给他转换成字符串
    name1 = etree.tostring(contents, method='html')
    # 转成字符串后中文不能正常显示，需要再对其进行解析
    name2 = HTMLParser().unescape(name1.decode())
    content = name2

2.只获取文本值

welfare = response.xpath('//div[@class="t1"]').xpath('string(.)').extract()[0]

或者

welfare = response.xpath('//div[@class="t1"]').xpath('string(.)').extract()[0]

注意：如果使用element来获取，会遇到extract属性不存在的错误可以将其改为如下代码：

welfare = response.xpath('//div[@class="t1"]').xpath('string(.)').strip()

使用xpath获取标签下所有文本值（包括子标签的值）

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关使用jQuery获取HTML标签的值

相关 jquery怎么获取当前标签父标签的值

相关使用xpath获取标签下所有文本值（包括子标签的值）

相关 xpath 下拉框定位（文本定位标签值一样）

相关 jQuery如何获取同一个类标签的所有的值

相关 html 获取标签name属性的值,Python HTML解析,获取标签名称及其值

相关 jq获取标签value\name\文本值

相关 vue 设置标签data值，获取标签data参数

相关使用 lxml 中的 xpath 高效提取文本与标签属性值

相关使用 lxml 中的 xpath 高效提取文本与标签属性值

随便看看

IDEA笔记 -- springBoot生成过滤不需要查看脚本

光条中心线提取-Steger算法（基于Hessian矩阵）类似于ArcScan提取道路中心线

你还记得那些曾经为腾讯企鹅军团做的贡献吗？

CSS 中的 transform-origin 属性

kubernetes无法删除namespace的问题

scrapy实战----将数据存储到csv文件和MySQL数据库中

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表