Python解析HTML可以使用BeautifulSoup库,它是一个用于从网页抓取数据的Python库,以下是一个简单的示例:
确保已经安装了BeautifulSoup库,如果没有安装,可以通过以下命令安装:

(图片来源网络,侵删)
pip install beautifulsoup4
我们将使用BeautifulSoup库解析HTML内容,假设我们有以下HTML代码:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>示例网页</title>
</head>
<body>
<h1>欢迎来到示例网页</h1>
<p>这是一个段落。</p>
<ul>
<li>列表项1</li>
<li>列表项2</li>
<li>列表项3</li>
</ul>
</body>
</html> 我们可以使用以下Python代码解析HTML并提取信息:
from bs4 import BeautifulSoup
html_doc = """
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>示例网页</title>
</head>
<body>
<h1>欢迎来到示例网页</h1>
<p>这是一个段落。</p>
<ul>
<li>列表项1</li>
<li>列表项2</li>
<li>列表项3</li>
</ul>
</body>
</html>
"""
创建BeautifulSoup对象
soup = BeautifulSoup(html_doc, 'html.parser')
提取标题
title = soup.title.string
print("标题:", title)
提取段落文本
paragraph = soup.p.string
print("段落:", paragraph)
提取列表项
list_items = soup.find_all('li')
for item in list_items:
print("列表项:", item.string) 运行上述代码,将输出以下结果:
标题: 示例网页 段落: 这是一个段落。 列表项: 列表项1 列表项: 列表项2 列表项: 列表项3
这样,我们就可以使用BeautifulSoup库轻松地解析HTML文档并提取所需的信息。
以上就是关于“python解析html_HTML输入”的问题,朋友们可以点击主页了解更多内容,希望可以够帮助大家!

(图片来源网络,侵删)

(图片来源网络,侵删)
本文来源于互联网,如若侵权,请联系管理员删除,本文链接:https://www.9969.net/81390.html