python bs4模块 BeautifulSoup 学习笔记

曾经终败给现在 2022-05-19 08:12 365阅读 0赞

bs4 模块的 BeautifulSoup 可以用来爬取html页面的内容，配合requests库可以写简单的爬虫。

1、利用requests请求html页面，获取HTML页面内容

import requests
from bs4 import BeautifulSoup
session = requests.session()
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
session.headers.update(headers)
# step 1  打开登陆页面
url = 'http://10.10.10.10/xx'
r = session.get(url)
html = r.text

2、利用BeautifulSoup，解析HTML得到想要的信息

soup = BeautifulSoup(html, 'html.parser')
# BeautifulSoup支持多种元素定位方式，也支持CSS定位,得到的是一个列表，列表中的元素信息可以用get方法获取
s1 = soup.select('#id')[0].get('value')
#S1 就是对应元素value属性的值
print(s1)

发表评论取消回复

表情：

评论列表（有 0 条评论，365人围观）

还没有评论，来说两句吧...

相关阅读

相关 python bs4/BeautifulSoup TypeError: an integer is required

提: 今天在使用bs4做爬虫的时候使用的IDLE进行的桌面爬虫执行了一段代码: ![20190906090507654.png...

迷南。/ 2024年04月18日 11:30/ 0 赞/ 165 阅读

相关 python模块--BeautifulSoup4 和 lxml

BeautifulSoup4和lxml 　　这两个库主要是解析html/xml文档，BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择

爱被打了一巴掌/ 2023年10月08日 08:47/ 0 赞/ 160 阅读

相关模块安装 | bs4

1.首先先安装pip Ubuntu： \`sudo apt install python-pip\` \`sudo pip install --upgrade

女爷i/ 2023年07月19日 08:16/ 0 赞/ 104 阅读

相关【Python网络爬虫笔记】BeautifulSoup模块基础

学习资源：[中国大学MOOC Python网络爬虫与信息提取北京理工大学计算机学院嵩天][MOOC Python_ _] -------------------- 安

悠悠/ 2023年07月18日 06:17/ 0 赞/ 104 阅读

相关【Python】学习笔记总结4（Python模块）

文章目录四、Python模块 1.import导入模块 2.from...import导入模块 3.as 给模块取别名

柔情只为你懂/ 2023年02月28日 12:54/ 0 赞/ 60 阅读

相关 Python3安装bs4（BeautifulSoup4）

pip3 install beautifulsoup4 如果使用国外的源下载速度慢，我们可以使用国内的源进行提速：豆瓣源 pip3

迈不过友情╰/ 2023年02月20日 12:29/ 0 赞/ 146 阅读

相关【python初级】使用bs4. BeautifulSoup解析网页介绍

【python初级】使用bs4. BeautifulSoup解析网页 1.背景 2.安装 3.简单示例 1.背景爬虫模拟浏览器获取网页的数据。

灰太狼/ 2022年11月21日 11:46/ 0 赞/ 361 阅读

相关 Python爬虫包 BeautifulSoup 学习（四） bs基本对象与函数

四大对象种类 BeautifulSoup将复杂HTML文档转换成一个复杂的树形结构。如图所示 ![这里写图片描述][SouthEast] 每个节点都是Python对象

àì夳堔傛蜴生んèń/ 2022年07月13日 04:22/ 0 赞/ 308 阅读

相关 python bs4模块 BeautifulSoup 学习笔记

bs4 模块的 BeautifulSoup 可以用来爬取html页面的内容，配合requests库可以写简单的爬虫。 1、利用requests请求html页面，获取HTML页

曾经终败给现在/ 2022年05月19日 08:12/ 0 赞/ 366 阅读

相关 python爬虫小白之bs4：pip install BeautifulSoup错误汇总

做爬虫时大都多数会用到Beautiful Soup，它是用Python写的一个HTML/XML的解析器，它可以很好的处理不规范标记并生成剖析树(parse tree)。它提

本是古典何须时尚/ 2022年05月17日 06:28/ 0 赞/ 471 阅读