位置: 编程技术 - 正文

利用PHP抓取百度阅读的方法示例(php 抓取别的网站的内容)

编辑:rootadmin

推荐整理分享利用PHP抓取百度阅读的方法示例(php 抓取别的网站的内容),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:php爬取,php如何获取百度的查询结果,php 抓取别的网站的内容,php 抓取别的网站的内容,php如何获取百度的查询结果,利用php抓取百度网盘资源,利用php抓取百度网盘文件,利用php抓取百度网盘资源,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

这篇文章主要介绍的是,如何利用PHP抓取百度阅读的方法,下面话不多说,来一起看看吧。

抓取方法如下

首先在浏览器里打开阅读页面,查看源代码后发现小说的内容并不是直接写在页面里的,也就是说小说的内容是通过异步加载而来的。

利用PHP抓取百度阅读的方法示例(php 抓取别的网站的内容)

于是将chrome的开发者工具切到network一栏,刷新阅读页面,主要关注的是XHR和script两个分类下。

经过排查,发现在script分类下有个jsonp请求比较像是小说内容,请求的地址是

div等等,c属性就是内容了,但也有两种可能,一个是字符串,另一个是数组,数组的每个元素都是一个节点。

这种结构最好解析了,用一个递归就搞定

最终代码如下:

这个类前两个参数可以从小说的介绍页面获得,第一个参数bookId就是url里ebook后面跟着的字符串,第二个参数bookToken在页面源代码搜索bdjsonUrl,m参数后面的那个字符串就是。

注:如果不传入百度cookie或者百度cookie无效,则只能抓取免费阅读部分,要抓完整的内容必须保证cookie可以正常使用。

总结

本文链接地址:https://www.jiuchutong.com/biancheng/296381.html 转载请保留说明!

上一篇:Yii2中datetime类的使用(datetime2(7))

下一篇:Yii2——使用数据库操作汇总(增删查改、事务)

免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

鄂ICP备2023003026号

网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

友情链接: 武汉网站建设 电脑维修 湖南楚通运网络