位置: IT常识 - 正文

python中htmlparser解析html

编辑:rootadmin

推荐整理分享python中htmlparser解析html,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

python中htmlparser解析html

说明

1、htmlparser提供了一种方便简洁的处理html文件的方法。

它根据树形结构将html页面中的标签分析成一个节点,一种类型的节点对应一个类,通过调用它可以轻松访问标签中的内容。

2、html本质上是xml的子集,但是html的语法没有html严格,不能用标准的DOM或者SAX来分析html。

实例

fromhtml.parserimportHTMLParserfromhtml.entitiesimportname2codepointclassMyHTMLParser(HTMLParser):defhandle_starttag(self,tag,attrs):print('<%s>'%tag)defhandle_endtag(self,tag):print('</%s>'%tag)defhandle_startendtag(self,tag,attrs):print('<%s/>'%tag)defhandle_data(self,data):print(data)defhandle_comment(self,data):print('<!--',data,'-->')defhandle_entityref(self,name):print('&%s;'%name)defhandle_charref(self,name):print('&#%s;'%name)parser=MyHTMLParser()parser.feed('''<html><head></head><body><!--testhtmlparser--><p>Some<ahref=\"#\">html</a>HTMLtutorial...<br>END</p></body></html>''')//test结果<html><head></head><body><!--testhtmlparser--><p>Some<a>html</a>HTMLtutorial...<br>END</p></body></html>

以上就是python中htmlparser解析html,希望对大家有所帮助。更多Python学习指路:Python基础教程

本文链接地址:https://www.jiuchutong.com/zhishi/310474.html 转载请保留说明!

上一篇:DedeCMS V5.7 SP2前台文件上传漏洞

下一篇:python __init__()的使用注意(python里面init)

免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

鄂ICP备2023003026号

网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

友情链接: 武汉网站建设 电脑维修 湖南楚通运网络