位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 印花税的征税范围具体有哪些
  • 城建税的计税依据是增值税和消费税的和吗
  • 车辆购置税是什么税种
  • 网银转账与支票的区别
  • 一般纳税人条件要求2020
  • 个体工商户属于非法人组织吗
  • 金蝶k3如何设置凭证保存自动新增
  • 发票同步功能在哪里
  • 营业账簿指什么
  • 增值税专票经办人怎么填
  • 没有抵扣的发票怎么入账
  • 当期允许抵扣的农产品进项税额
  • 公司年会聚餐的简短讲话
  • 交易性金融资产公允价值变动计入
  • 营改增后哪些费用可以抵扣
  • 在筹建期间的费用属于什么
  • 冲减留抵税会计分录
  • 税务顾问费怎么做账务处理?
  • 货物运输代理服务税率
  • 劳务公司开票是开劳务费还是工程服务
  • 本月没有发生额本月合计
  • 物业管理体现在哪些地方
  • 工资可以一次性计提全年的吗
  • 普通发票没有进账怎么办
  • 汇算清缴退税怎么调整金额
  • 企业债卷利息收入是营业收入吗
  • 附加税是按照应交增值税还是已交
  • 新买的电脑如何激活windows
  • 应交税费进项税额在借方说明什么
  • Win10 Build 19043.1147 (21H1)预览通道更新补丁KB5004296(附完整更新日志)
  • slam方法
  • 微信公众号web开发
  • 注销小规模公司需要什么材料
  • 应收票据其他应收款都需要提取坏账准备么
  • 出租经营的开发产品应视为企业的
  • php实现简单的登录验证
  • python模块怎么写
  • 专票如何申领
  • css选择器nth
  • vue的slice
  • vue 插槽详解
  • 私人定制ai绘画下载
  • 购买礼品的会计怎么做账
  • 固定资产清理怎么报税呢
  • centos上安装vscode
  • 特惠贷利息怎么算
  • 小规模纳税人怎么开增值税专用发票
  • 固定资产清理净残值怎么处理
  • 残保金滞纳金免征吗
  • sqlsever注释符号
  • 增值税进项税销项税月末需要结转吗
  • 纳税申报相关操作有哪些
  • 应交税费和应交增值税的关系
  • 向非关联企业捐赠现金
  • 土地储备委员会职责
  • jdbc连接MySQL实验总结
  • mysql 去除重复查询结果
  • windows server 2008 r2离线激活
  • centos安装详细
  • upromise0.exe - upromise0进程是什么文件
  • linux 命令
  • mac锁定快捷键
  • RegSrvc.exe - RegSrvc是什么进程 有什么用
  • win10系统怎么配置交换机
  • pavprsrv.exe - pavprsrv是什么进程 有什么用
  • win8怎样恢复系统
  • win7旗舰版系统激活密钥
  • win10预览版好吗
  • unity 加载文件 卡顿
  • perl处理特殊符号
  • js中的apply方法
  • android使用webview加载网页
  • vue怎样使用
  • jquery右击事件
  • jquery warp
  • shell 执行sh
  • 国家税务总局在哪
  • 306医院改名什么了
  • 税控服务费抵扣填哪
  • 注册管理税务师和注册税务师的区别
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设