位置: 编程技术 - 正文

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

编辑:rootadmin

推荐整理分享NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node爬虫框架puppeteer,nodejs做爬虫,node.js写爬虫,node python 爬虫,nodejs爬取数据,node.js写爬虫,nodejs做爬虫,node js爬虫,内容如对您有帮助,希望把文章链接给更多的朋友!

书接上回,我们需要修改程序以达到连续抓取个页面的内容。也就是说我们需要输出每篇文章的标题、链接、第一条评论、评论用户和论坛积分。

如图所示,$('.reply_author').eq(0).text().trim();得到的值即为正确的第一条评论的用户。

{<1>}

在eventproxy获取评论及用户名内容后,我们需要通过用户名跳到用户界面继续抓取该用户积分

在eventproxy这一次中,我们要找到score是放在哪里(class="big")。

{<2>}

找到classname就好办了,我们先试着把结果输出一下

运行程序,这段代码得到的结果。

NodeJS制作爬虫全过程(续)(nodejs爬虫框架crawler)

{<3>}

但是问题来了,我们在.end()的回调函数中能正确输出结果,但是不能正确的输出outcome。仔细一看,需要输出的outcome是一个Request对象。这是因为粗心犯的错的,.end()函数并不会传递返回值给Request对象,需要将结果返回到上一层(users)。

把users好好地输出发现除了score1其他是正确值。仔细调试发现,程序是先进行了console.log(),然后再进行.map()。更准确地说,在.map()函数内,.get()的回调函数并没有执行完赋值score,return 返回值就进行了。这就是回调函数的异步,而外层的同步操作是不会等待回调函数做完操作的。

{<4>}

我的做法就是eventproxy再emit一层消息,伴随着消息把需要的数据一起传递给接收消息操作.after(),只有当消息全部接收完毕,再打印出传递的参数(结果)。

{<6>}

这个问题解决了,但score1的数值好像太大了点吧。再一看,原来class='big'有两个,用户的话题收藏也是属于这个class。我们得通过cheerio的.slice( start, [end] )来切取第一个元素,即将score 修改为 score = $('.big').slice(0).eq(0).text().trim();。正确结果如图。

{<7>}

sails框架的学习指南 上周通过搭建CMS系统接触到了sails框架,知道一些ORM的概念。这周开始深入后台数据交互,发现twenty框架的数据结构在sails上又设计了一番(比如node、cat

node.js开机自启动脚本文件 #!/bin/bash###BEGININITINFO#Provides:xiyoulib#Required-Start:$all#Required-Stop:$all#Default-Start:#Default-Stop:#Short-Description:Startdaemonatboottime#Description:Enableserviceprovidedbydaem

node.js中的path.extname方法使用说明 方法说明:返回path路径文件扩展名,如果path以‘.'为结尾,将返回‘.',如果无扩展名又不以'.'结尾,将返回空值。语法:path.extname(p)由于该方法属于pa

标签: nodejs爬虫框架crawler

本文链接地址:https://www.jiuchutong.com/biancheng/374216.html 转载请保留说明!

上一篇:NodeJS制作爬虫全过程(node.js写爬虫)

下一篇:sails框架的学习指南(spiral框架)

  • 盈余公积计提比例必须是10%么
  • 员工外出办事报备制度
  • 城镇土地使用税纳税义务发生时间
  • 小规模纳税人可以开数电专票吗
  • 土地入固定资产还是无形资产
  • 上季度忘记申报个税了
  • 房地产开发企业预缴增值税
  • 未及时扣除的分数怎么算
  • 事业单位收到借款分录
  • 物流企业差额征税
  • 返利红字发票怎么做账
  • 工会发放节日慰问
  • 没有ca证书怎么办社保
  • 商贸公司购买货物会计分录
  • 小规模纳税人免征增值税怎么记账
  • 公司账户有钱怎么取出来
  • 内部员工购买公司产品
  • 苹果静音模式siri
  • 电脑找不到休眠设置了
  • 企业帐薄包括哪些
  • 溢价购入债权投资是为啥
  • 房屋租赁合同变更
  • 电脑管家lol修复
  • 备用金借款有利息吗
  • 行政单位预付款已收到货物无发票
  • csrsv.exe是什么
  • mmtray2k.exe有什么作用 是什么进程 mmtray2k进程查询
  • win7旗舰版叫啥
  • LangChain Agent 执行过程解析 OpenAI
  • php splqueue
  • 实物资产的管理
  • 业务招待费用列支范围
  • 职工教育经费的计提比例是多少
  • 10-Ajax&Vue
  • 公司给员工租房进项税可以抵扣吗
  • 老板天天吸烟
  • 预缴所得税年底处理账务吗
  • 工会经费的主要用途
  • 公司聘用临时工需要买社保吗
  • 工程附加税税率
  • 制造费用一定要摊销吗
  • 增值税申报表是含税还是不含税
  • 房地产公司收到客户违约金会计科目
  • 预付账款怎么记账
  • 国有企业投资程序
  • 全资子公司的利润怎么记录母公司报表
  • 个人所得税要计入管理费用吗
  • 企业年金个税怎么计算
  • 收入分成的账务处理
  • 房地产开发公司是做什么的
  • 退货只能退一半价钱合理吗
  • 预付账款的
  • 为什么要挂靠其他劳务派遣公司?有什么利弊?
  • 租赁期限为一年
  • 商品销售成本的计算可以采用逆算成本法,其操作方法是
  • 内部资金管理实施细则
  • mybatis分页插件的原理
  • mysql的主从复制模式
  • linux命令pwd是什么意思
  • win7禁用了管理员,怎么取消呢
  • linux中rwx
  • php创建注释的方法
  • win8.1开始菜单怎么改成win7那样
  • WIN10系统怎么改成泰语
  • windows8装windows10,文件会丢失吗
  • win10系统应用更新
  • android环境搭建实训心得
  • fetch怎么用
  • js 异步队列
  • 老生常谈的道理
  • 如何修改apache端口号
  • linux,windows
  • JavaScript中的NaN代表什么
  • python xml dom
  • 省市区三级联动下拉表单
  • 使用jQuery的toggle()方法对HTML标签进行显示、隐藏的方法(示例)
  • android拖拽
  • 汽车车船税怎么交
  • 地税占税收的比例多少
  • 010是哪个市区的电话号码
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设