位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 政府补助是否可以抵扣税
  • 特别关税是多少人民币
  • 库存盘盈盘亏要调整吗
  • 企业捐赠灾区
  • 减去税率怎么算
  • 经营活动现金流量公式
  • 债务重组损益的计算公式
  • 扶贫费用事业单位账务处理怎么做?
  • 注册资金未到账需要缴纳印花税吗
  • 财产租赁合同金额含税吗
  • 企业购车票可以抵扣增值税吗?
  • 不管金税四期上线与否,税务严查一刻也没有放松!
  • 合同是怎么影响企业纳税的?
  • 股权转让的标的
  • 对公账户管理费怎么收
  • 公司绿化购买的苗木如何进行账务处理?
  • 所得税申报季末资产总额怎么填
  • 利润表季度报表
  • 营改增后城建税怎么算
  • 公司收到的应收股利需要分配利润吗
  • 劳务报酬纳税计算器
  • 苹果推送最新系统
  • .exe是什么文件
  • 资产减值准备为什么在贷方
  • 企业的存货采用计划成本核算,某年年末,结
  • vue for循环遍历对象取值
  • 收到银行承兑汇票的账务处理
  • php strncmp
  • javascripts
  • 开源代码网站github
  • web攻防之业务安全实战指南在线阅读
  • 若依vue教程
  • hexdump windows
  • c语言 *指针
  • 入库税款异常是啥意思
  • 滴滴打车的发票是什么样子
  • 利息收入凭证会计分录
  • 帝国主义
  • 织梦cms要钱吗
  • 应收处理的两大内容是什么
  • 法人股东 分红
  • 如何设置长期有效的二维码
  • 事业单位结余分配的去向有
  • 应收账款资金占用费怎么算
  • 购买汽车轮胎的注意事项
  • 收银系统入库入错了怎么办
  • 贷款保险费能否抵扣个税
  • 装修费用一次性税前扣除
  • 手续费和利息费用的区别
  • 甲方扣水电费施工方是否开票
  • 其他资本公积是利得吗
  • 账簿按形式分几种
  • sql server数据库中的null(空值)
  • sql server获取字段长度
  • jdbc数据库连接步骤
  • 关于要不要关闭Vista中的IPv6功能的问题
  • commserver什么意思
  • dvd rom drive bbs priorities
  • win10教育系统
  • mac文稿怎么查看字数
  • debian怎么用
  • win10系统中怎么打开IE浏览器
  • 怎么在linux中安装软件
  • android app启动过程
  • 广告文章叫什么
  • jquery选择器的使用
  • 精灵动画片大全90年代
  • 修改文件名ren
  • ubuntu服务器配置代理访问外网
  • JavaScript中setUTCMilliseconds()方法的使用详解
  • jquery中如何获取元素?
  • nodejs操作mysql数据库
  • recyclerview和scrollview
  • 面向对象设计六大原则
  • python中scipy用法
  • 境外付汇税务备案要多久
  • 莱钢生产什么产品
  • 公司自有房屋装修费用入什么料目
  • 上海税务局怎么变更财务负责人
  • 税法上接受捐赠是什么
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设