位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 企业所得税营业收入是含税还是不含税
  • 个税网络申报
  • 企业所得税计提分录
  • 减免房产税土地使用税 账务处理
  • 个人所得税申报错误如何更正申报
  • 融资租赁租入固定资产折旧可以税前扣除吗
  • 对赌协议补偿款计入哪个科目
  • 融资租赁出租方会计处理
  • 小规模购买金税盘可以全额抵扣吗
  • 承包外单位食堂会计怎么做账
  • 预售房提前还款需要去解押吗
  • 没取得发票付款的情况该如何做账呢?
  • 固定资产所取得的成本
  • 筹备费用怎么扣税的
  • 河道维护费所有权归属
  • 餐饮发票增值税税率是多少
  • 营改增工程计价规则
  • 纳税人提供植物养护服务属于什么服务
  • 税控盘怎么使用
  • 增值税零申报,企业所得税会有税额吗
  • 其他业务收入和其他业务成本
  • 一般纳税人交的增值税可以抵扣吗
  • 收到汇票怎么承兑
  • Windows无法启动服务
  • 业务招待住宿费发票可以抵扣进项税吗
  • Windows11怎么免费升级专业版
  • 模具成本怎么核算
  • thinkphp6验证器
  • win10任务栏还原到下边
  • apcu php
  • 企业收入的具体表现
  • 职工教育经费会计账务处理
  • 转销坏账准备的会计分录有一个还是两个
  • php抓取网页图片
  • php获取ipv6地址
  • php怎么输出文字
  • 哪些免征增值税
  • 残保金政策建议
  • vue插槽的使用场景
  • 企业利润分配的通常去向包括
  • 公司注销公司名下的房子怎么办
  • 纳税调增调减通俗易懂
  • python2多进程
  • python {:s}
  • pythongui库
  • 未出资到位的股权转让个人所得税
  • 现代服务税目包括哪些具体分类
  • 保险车辆理赔入账流程
  • 电子税务局没有增值税申报怎么办?
  • 工程施工资产负债表怎么填
  • 材料退库的流程
  • 固定资产内部抵扣增值税
  • 文化传媒公司的主营业务
  • 长期股权投资损益调整
  • 企业会计准则第4号固定资产
  • 劳务派遣可以享受产假吗
  • 如何远程连接小米摄像头
  • 数据库保护数据方式
  • linux转移文件代码
  • u极速u盘启动官网
  • ahci提升有多大
  • win7任务栏快捷启动如何设置
  • linux怎么用shell
  • macbookpro如何语音输入
  • bootcamp不用u盘
  • mmtray2k.exe有什么作用 是什么进程 mmtray2k进程查询
  • P2P Networking2.exe - P2P Networking2是什么进程 有什么用
  • win7耳机和外放一起响
  • shell脚本中计算变量除法
  • 批处理文件bat
  • 深入理解javascript特性.pdf
  • js parseint parsefloat
  • websocket方法
  • listview属性设置
  • python黑帽子怎么样
  • 1、Android Studio创建android项目
  • comparable接口怎么用
  • 股权转让查账重点查什么
  • 北京社保个人账户10万元退休金多少
  • 云南省国税发票查询真伪查询
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设