位置: 编程技术 - 正文

如何采集微信公众号历史消息页(公众号采集文章手机操作)

编辑:rootadmin

推荐整理分享如何采集微信公众号历史消息页(公众号采集文章手机操作),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:微信公众号数据采集,微信公众平台怎么采集文章,如何采集微信公众号的文章,如何采集微信公众号的文章,如何采集微信公众号视频,微信公众平台怎么采集文章,如何采集微信公众号视频,如何采集微信公众号的文章,内容如对您有帮助,希望把文章链接给更多的朋友!

采集微信文章和采集网站内容一样,都需要从一个列表页开始。而微信文章的列表页就是公众号里的查看历史消息页。现在网络上的其它微信采集器有的是利用搜狗搜索,采集方式虽然简单多了,但是内容不全。所以我们还是要从最标准最全面的公众号历史消息页来采集。

因为微信的限制,我们能复制到的链接是不完整的,在浏览器中无法打开看到内容。所以我们需要通过上一篇文章介绍的方法,使用anyproxy获取到一个完整的微信公众号历史消息页面的链接地址。

其中localhost可以替换成自己的IP地址或域名。从列表中找到getmasssendmsg开头的记录,点击之后右侧就会显示出这条记录的详情:

红框部分就是完整的链接地址,将微信公众平台这个域名拼接在前面之后就可以在浏览器中打开了。

如何采集微信公众号历史消息页(公众号采集文章手机操作)

然后将页面向下拉,到html内容的结尾部分,我们可以看到一个json的变量就是历史消息的文章列表:

我们将msgList的变量值拷贝出来,用json格式化工具分析一下,我们就可以看到这个json是以下这个结构:

简要的分析一下这个json(这里只介绍一些重要的信息,其它的被省略):

在这里还要提到一点就是如果希望获取到时间更久远一些的历史消息内容,就需要在手机或模拟器中将页面向下拉,当拉到最底下的时候,微信将自动读取下一页的内容。下一页的链接地址和历史消息页的链接地址同样是getmasssendmsg开头的地址。但是内容就是只有json了,没有html了。直接解析json就可以了。

这时可以通过上一篇文章介绍的方法,使用anyproxy将msgList变量值正则匹配出来之后,异步提交到服务器,再从服务器上使用php的json_decode解析json成为数组。然后遍历循环数组。我们就可以得到每一篇文章的标题和链接地址。

如果只需要采集单一公众号的内容,完全可以在每天群发之后,通过anyproxy获取到完整的带有key和pass_ticket的链接地址。然后自己制作一个程序,手动将地址提交给自己的程序。使用例如php这样的语言来正则匹配到msgList,然后解析json。这样就不用修改anyproxy的rule,也不需要制作一个采集队列和跳转页面了。

php提取身份证号码中的生日日期以及验证是否为成年人的函数 php提取身份证号码中的生日日期以及确定是否成年的一个函数。可以同时确定位和位的身份证,经本人亲测,非常好用,分享函数代码如下:php//用ph

php猜单词游戏 直接复制本地运行就可以了phpsession_start();header("Content-type:text/html;charset=utf-");$url='

Session 失效的原因汇总及解决丢失办法 昨天去GTSC面试,有面试官问我关于Session丢失之后怎么查的问题,说老实话,开发到现在很少碰到这样的情况,唯一想到的就是Session超时,还有就是做Se

标签: 公众号采集文章手机操作

本文链接地址:https://www.jiuchutong.com/biancheng/275970.html 转载请保留说明!

上一篇:PHP写微信公众号文章页采集方法(php推送微信公众号客户消息)

下一篇:php提取身份证号码中的生日日期以及验证是否为成年人的函数(身份证信息提取python)

  • 税控盘的维护费
  • 支付给员工的工资属于什么科目
  • 企业税后利润留用比例怎么算?
  • 企业所得税的征收对象是什么
  • 兼职会计负责的工作内容
  • 税控盘抵减增值税需要结转吗
  • 上月有留抵税额本月怎么申报
  • 无形资产升值怎么处理
  • 母子公司无偿划转股权印花税
  • 零息债券支付利息吗
  • 个税专项扣除是什么时候开始实行
  • 预收账款和预付账款什么时候用
  • 事业单位结余如何分配
  • 异地工程缴纳增值税
  • 企业借款增加实际成本
  • 手表的发票可以报销吗
  • 合伙制创投企业与合伙制创投基金
  • Mac怎么禁用icloud
  • 电脑怎么备份系统win7
  • 专家评审费如何报账
  • 如何调整任务栏图标大小
  • 单位卖二手车需交税吗
  • 报销各种费用怎么做分录
  • php字符串定义的三种方式
  • 教育发展基金计提比例
  • 篱笆的样子
  • 租金收入会计分录怎么写
  • 琥珀山庄位于我国哪个省
  • thinkphp删除文件
  • thinkphp框架入门
  • phpinfo()中Loaded Configuration File(none)的解决方法
  • 国内旅客运输服务普票可以抵扣吗
  • javascript教程
  • 微信小程序人民法院审核通过多久立案
  • 《推荐一个好地方》图书馆
  • win11设置项改中文
  • 抄税前要做什么
  • 运输发票备注栏里一般需要备注的内容包括
  • 税控盘费和服务费都可以减免吗
  • 异地预缴印花税怎么做账
  • 快递费属于办公费用吗?
  • python的多进程模块
  • mongodb document
  • 工程项目该如何分类
  • 收据可以当发票吗?
  • 2023年终奖一次性扣税对照表
  • 购买材料增值税税率
  • 计提的坏账应该计入哪个科目
  • 购买货物对方代垫的运输费分录
  • 财政补助结转结转的依据
  • 应付工资比计提工资高
  • 把公司设备操作坏了怎么担责
  • 保理手续费计入投资收益吗
  • 改制基准日对人员的影响
  • mysql格式化日期yyyy/mm/dd
  • sql servererror40
  • mysql 使用inet_aton和inet_ntoa处理ip地址数据的实例
  • win7系统IE浏览器版本
  • win8怎么让我的电脑显示在桌面上
  • windowxp宽带连接
  • window 虚拟化
  • 虚拟机怎么安装exe文件
  • 主板升级bios失败怎么办
  • mission controller
  • windows 11安全模式
  • windowsxp桌面没有我的电脑
  • sf2是什么文件
  • 2015.3.25--2.cocos精灵移动 动画控制(一)
  • 原生js怎么获取input值
  • 自定义dialogfragment
  • shell脚本的fi
  • 针对后台列表table拖拽比较实用的jquery拖动排序
  • 深入理解javascript特性
  • 关于python中的判断条件
  • python批量ping
  • javascript面向对象编程
  • android自定义view的三大流程
  • 税务局发票邮寄回来怎么读入?
  • 季度申报成功与否怎么查询
  • 四川社保缴费后多久生效
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设