Python 第三方库

First Post:

2023-01-10

Last Update:

2023-01-13

bs4 库

bs4: 网页数据抓取库

1	`import bs4`

构造参数:

BeautifulSoup(html文本, 解析器)

搜索当前 tag 的所有 tag 子节点
返回符合条件的结果集 bs4.Element.ResultSet

当循环结果集时, 每个结果为一个字典

tags = html.find_all("div")

for element in tags:
    print(type(element))

find("title") 等价于 find_all("title", limit=1)

返回一个页面元素