位置: 编程技术 - 正文
推荐整理分享如何采集微信公众号历史消息页(公众号采集文章手机操作),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:微信公众号数据采集,微信公众平台怎么采集文章,如何采集微信公众号的文章,如何采集微信公众号的文章,如何采集微信公众号视频,微信公众平台怎么采集文章,如何采集微信公众号视频,如何采集微信公众号的文章,内容如对您有帮助,希望把文章链接给更多的朋友!
采集微信文章和采集网站内容一样,都需要从一个列表页开始。而微信文章的列表页就是公众号里的查看历史消息页。现在网络上的其它微信采集器有的是利用搜狗搜索,采集方式虽然简单多了,但是内容不全。所以我们还是要从最标准最全面的公众号历史消息页来采集。
因为微信的限制,我们能复制到的链接是不完整的,在浏览器中无法打开看到内容。所以我们需要通过上一篇文章介绍的方法,使用anyproxy获取到一个完整的微信公众号历史消息页面的链接地址。
其中localhost可以替换成自己的IP地址或域名。从列表中找到getmasssendmsg开头的记录,点击之后右侧就会显示出这条记录的详情:
红框部分就是完整的链接地址,将微信公众平台这个域名拼接在前面之后就可以在浏览器中打开了。
然后将页面向下拉,到html内容的结尾部分,我们可以看到一个json的变量就是历史消息的文章列表:
我们将msgList的变量值拷贝出来,用json格式化工具分析一下,我们就可以看到这个json是以下这个结构:
简要的分析一下这个json(这里只介绍一些重要的信息,其它的被省略):
在这里还要提到一点就是如果希望获取到时间更久远一些的历史消息内容,就需要在手机或模拟器中将页面向下拉,当拉到最底下的时候,微信将自动读取下一页的内容。下一页的链接地址和历史消息页的链接地址同样是getmasssendmsg开头的地址。但是内容就是只有json了,没有html了。直接解析json就可以了。
这时可以通过上一篇文章介绍的方法,使用anyproxy将msgList变量值正则匹配出来之后,异步提交到服务器,再从服务器上使用php的json_decode解析json成为数组。然后遍历循环数组。我们就可以得到每一篇文章的标题和链接地址。
如果只需要采集单一公众号的内容,完全可以在每天群发之后,通过anyproxy获取到完整的带有key和pass_ticket的链接地址。然后自己制作一个程序,手动将地址提交给自己的程序。使用例如php这样的语言来正则匹配到msgList,然后解析json。这样就不用修改anyproxy的rule,也不需要制作一个采集队列和跳转页面了。
php提取身份证号码中的生日日期以及验证是否为成年人的函数 php提取身份证号码中的生日日期以及确定是否成年的一个函数。可以同时确定位和位的身份证,经本人亲测,非常好用,分享函数代码如下:php//用ph
php猜单词游戏 直接复制本地运行就可以了phpsession_start();header("Content-type:text/html;charset=utf-");$url='
Session 失效的原因汇总及解决丢失办法 昨天去GTSC面试,有面试官问我关于Session丢失之后怎么查的问题,说老实话,开发到现在很少碰到这样的情况,唯一想到的就是Session超时,还有就是做Se
标签: 公众号采集文章手机操作
本文链接地址:https://www.jiuchutong.com/biancheng/275970.html 转载请保留说明!上一篇:PHP写微信公众号文章页采集方法(php推送微信公众号客户消息)
友情链接: 武汉网站建设