位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

发布时间:2024-02-27

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 个人所得税抵扣项目有哪些及金额
  • 增值税期末余额在哪方
  • 收回已冲销的坏账分录
  • 公司给离职员工多发工资怎么办
  • 清理往来账管理办法
  • 哪些收入减免所得税
  • 电子申报率较差的原因
  • 企业可以不弥补以前年度亏损吗
  • 收到抵物广告费的会计处理怎么做?
  • 存货呆滞是什么意思
  • 年度所得税汇算清缴报告在哪打印
  • 投资者撤回投资额300000
  • 个人去税务局能开什么类型的发票
  • 收到技术服务费计入什么科目
  • 增值税发票如何读入金税盘
  • 贴现的利息能不能取出来
  • 税款滞纳金怎么入账
  • 收到的发票开票人是管理员,这样可以吗?
  • 建筑业小规模纳税人认定标准
  • 增值税的税额是什么意思
  • 个人汽车租给公司租金需多少钱?
  • 用友t3怎么删除损益结转凭证
  • 文化建设事业费优惠政策
  • 小规模纳税人少计提的工资怎么办
  • 基金赎回未到账可继续买吗?
  • 房租付款和发票有关系吗
  • mac怎么转到苹果系统
  • 如何在Windows11上下载和安装 Minecraft
  • 利息股息红利所得属于综合所得吗
  • 公司卖旧车税务处理流程
  • mcappins.exe - mcappins进程是什么文件 什么意思.
  • 销售佣金在所得税里扣吗
  • php strrchr
  • 发票开具的有哪些原则
  • 同一控制下企业合并会计准则
  • 暂估入账的原材料有成本差异吗
  • 库存商品转在建工程 增值税
  • vue的actions
  • cjzc框架
  • 办理组织机构代码证需要什么材料
  • 矿产资源补偿费是什么
  • 企业没有研发费用怎么做账
  • mysql执行时间太长
  • vue动态修改scss变量
  • 汽车维修行业工时标准
  • 公司举办活动方案
  • sqlserver2019删除
  • 长期股权投资评估增值调整
  • 小规模纳税人的认定标准是什么
  • 开发成本期末有余额吗
  • 预缴增值税需要提供什么资料
  • 银行代付工资如何操作
  • 其他货币资金科目主要指
  • 施工总包能分包土方吗
  • 企业处置子公司
  • 公司股东可以买公司股票吗
  • 销售公司中的服务是什么
  • 因进出口商品引起的收支
  • 什么是计提坏账准备
  • 日记账自动生成
  • mysql基于什么模型
  • win8怎么升级到win10 bios设置
  • freebsd怎么安装软件
  • qplus.exe是什么进程
  • 无法识别的选项
  • 命令提示符操作方法
  • win10系统怎么把ie浏览器放到桌面
  • win10鼠标怎么换
  • linux系统的
  • cocos2dx官方文档
  • 炉石传说代码怎么导入
  • nodejs实战教程
  • bat查看ip地址和mac地址
  • 快速备份mysql数据库
  • JQUERY的AJAX请求缓存里的数据问题处理
  • 申请税务增票怎么写
  • 社保扣缴客户端下载
  • 税票开错了税费怎么退回来
  • 中国税务报订阅电话
  • 我国个人所得税起征点
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号