位置: 编程技术 - 正文
推荐整理分享Python利用Beautiful Soup模块修改内容方法示例(python利用format方法保留三位小数),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:python利用for循环求1到100的奇数之和,python利用while循环求1+2+3......+n的和,python利用while循环求1+2+3......+n的和,python利用csv模块在对csv文件进行操作,python利用beautifulsoup输出第五个的内容,python利用csv模块在对csv文件进行操作,python利用beautifulsoup输出第五个的内容,python利用beautifulsoup输出第五个的内容,内容如对您有帮助,希望把文章链接给更多的朋友!
前言
其实Beautiful Soup 模块除了能够搜索和导航之外,还能够修改 HTML/XML 文档的内容。这就意味着能够添加或删除标签、修改标签名称、改变标签属性值和修改文本内容等等。这篇文章非常详细的给大家介绍了Python利用Beautiful Soup模块修改内容的方法,下面话不多说,来看看详细的介绍吧。
修改标签
使用的示例 HTML 文档还是如下:
修改标签名称
修改标签属性值
添加新的标签
我们可以使用 new_tag 方法来生成一个新的标签,然后使用 append() 、insert() 、insert_after() 、insert_before()方法来将标签添加到 HTML 树中。
例如在上述的 HTML 文档的 ul 标签中添加一个 li 标签 。首先要生成新的 li 标签,然后将其插入到 HTML 树结构中 。并在 li 标签中插入相应的 div 标签。
修改字符串内容
修改字符串内容可以使用 new_string() 、append() 、insert() 方法。
删除标签节点
Beautiful Soup 模块提供了 decompose() 和 extract() 方法来删除节点。
decompose() 方法删除节点,不仅会删除当前节点,还会把其子节点一块删除了。
extract() 方法用来从 HTML 树中删除节点或者字符串内容。
删除标签内容
标签可能有 NavigableString 对象或者 Tag 对象作为它的子节点,移除所有的这些子节点可以使用 clear() 方法。这将会移除标签的所有的 .content。
修改内容的其他方法
除了上面说到的方法,还有其他方法用来修改内容。
insert_after() 和 insert_before() 方法
上面的两个方法能够在标签或者字符串的前面或者后面插入一个标签或者字符串。方法只能接收一个参数,要么是 NavigableString 对象要么是 Tag 对象。
replace_with() 方法
该方法是用一个新的标签或字符串内容替代原来的标签或者字符串,能够接收一个标签或者字符串作为输入。
wrap() 和 unwrap() 方法
wrap() 方法是用另一个标签来包裹一个标签或者字符串。
unwrap() 方法则和 wrap() 方法相反。
总结
友情链接: 武汉网站建设