位置: 编程技术 - 正文

Node.js+jade抓取博客所有文章生成静态html文件的实例(nodejs抓取网页内容)

编辑:rootadmin

推荐整理分享Node.js+jade抓取博客所有文章生成静态html文件的实例(nodejs抓取网页内容),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node抓包工具,node抓包,javascript抓包,js抓取数据,node抓包,node.js抓包,nodejs抓取网页内容,nodejs抓取网页内容,内容如对您有帮助,希望把文章链接给更多的朋友!

这篇文章,我们就把上文中采集到的所有文章列表的信息整理一下,开始采集文章并且生成静态html文件了.先看下我的采集效果,我的博客目前篇文章,1分钟不到就全部采集生成完毕了,这里我截了部分的图片,文件名用文章的id生成的,生成的文章,我写了一个简单的静态模板,所有的文章都是根据这个模板生成的.

项目结构:

好了,接下来,我们就来讲解下,这篇文章主要实现的功能:

1,抓取文章,主要抓取文章的标题,内容,超链接,文章id(用于生成静态html文件)

2,根据jade模板生成html文件

一、抓取文章如何实现?

非常简单,跟上文抓取文章列表的实现差不多

参数url就是文章的地址,把文章的内容抓取完毕之后,调用filterArticle( html ) 过滤出需要的文章信息(id, 标题,超链接,内容),然后用jade的renderFile这个api,实现模板内容的替换,

Node.js+jade抓取博客所有文章生成静态html文件的实例(nodejs抓取网页内容)

模板内容替换完之后,肯定就需要生成html文件了, 所以用writeFile写入文件,写入文件时候,用id作为html文件名称。这就是生成一篇静态html文件的实现,

接下来就是循环生成静态html文件了, 就是下面这行:

if ( aUrl.length ) crawlerArc( aUrl.shift() );

aUrl保存的是我的博客所有文章的url, 每次采集完一篇文章之后,就把当前文章的url删除,让下一篇文章的url出来,继续采集

完整的实现代码server.js:

layout.jade文件:

后续的打算:

1,采用mongodb入库

2,支持断点采集

3,采集图片

4,采集小说

等等....

以上这篇Node.js+jade抓取博客所有文章生成静态html文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持积木网。

在 Node.js 中使用原生 ES 模块方法解析 从版本8.5.0开始,Node.js开始支持原生ES模块,可以通过命令行选项打开该功能。新功能很大程度上得归功于BradleyFarias。1.演示这个示例的代码目录结构如

深入理解Node.js中通用基础设计模式 谈到设计模式,你可能会想到singletons,observers(观察者)或factories(工厂方法)。本文不并专门探讨他们。只是探讨Node.JS一些基础模式的实现,像依赖

在Debian(Raspberry Pi)树莓派上安装NodeJS的教程详解 在树莓派上运行NodeJS并不需要特别的配置,你只需要确保可以用openssh远程连接到你的树莓派。安装并配置OpenSSH服务器它可以确保你能远程连接到树莓派

标签: nodejs抓取网页内容

本文链接地址:https://www.jiuchutong.com/biancheng/379517.html 转载请保留说明!

上一篇:Nodejs中使用phantom将html转为pdf或图片格式的方法(nodejs使用视频教程)

下一篇:在 Node.js 中使用原生 ES 模块方法解析(node.js使用教程)

  • 差额征税怎么填写申报表
  • 分包从属总包选择简易计税可以吗
  • 已认证的专票发票在哪里
  • 收购公司财务如何管理
  • 代扣个人社保的账务处理
  • 货物无偿赠送分录
  • 企业发票专用章使用涉及的审批流程
  • 交通补贴和通讯补贴怎么发合理
  • 用银行存款支付罚款
  • 费用的完成率怎么计算
  • 实发工资比计提多汇算清缴要怎么处理
  • 第三方协议补贴
  • 企业收到非金融机构利息收入怎么做账务处理
  • 一次性收到跨期租赁费会计分录
  • 单位购买的团体意外险会计分录
  • 工商年报中的纳税总额是所属期应交还是实交税额
  • 分公司可以再开分公司吗
  • 增值税发票普票和专票有什么区别
  • 电子发票字体不同
  • 车位租赁费和房屋租赁能开一张发票吗
  • 出口企业内销商怎么做
  • 非金融企业之间的借款合同要交印花税吗
  • 转让金融商品应交增值税怎么算
  • 劳务费和服务费税率一样吗
  • mac上安装
  • win11中文安装包
  • 年末进公司有年终奖吗
  • PHP:imagecolordeallocate()的用法_GD库图像处理函数
  • 总分机构 分总机构
  • Yii2中添加全局函数的方法分析
  • php数组数据结构
  • 滴滴发票开公司名称可以抵扣进项吗
  • 应收账款确认无法收回
  • 员工保险个人部分交多少
  • 数据分析利器:pandas库的应用课后答案
  • python怎样学
  • 企业账户有什么好处
  • phpcms v9官网
  • 科技型中小企业查询
  • 旅行社专票开票内容的规定
  • 免征的教育费附加怎么做账
  • 银行本票和汇票的定义
  • 外国人在我国境内被刑事拘留
  • 银行承兑到期后几天内有效
  • 个人社保交错了怎么办
  • 现金折扣属于什么
  • 三代手续费支付申请表怎么填
  • 净值是原值减去折旧吗?
  • sql查询语句大全实例教程
  • 销售费用怎么用
  • 专门借款本金汇兑差额
  • 公司给买员工保险
  • 坏账准备的帐务处理
  • 城建税及教育附加税税率是多少
  • 营业外收入是否影响营业利润
  • 个体工商户可以变更法人吗
  • mysql安装出问题
  • mysql数据库innodb
  • mysql5.7.17下载
  • win7系统远程
  • windows2003 IIS6.0 asp配置技巧
  • centos6安装步骤
  • 电脑怎样进入安全模式
  • win10怎么设置net3.5
  • linux 操作系统
  • outpost.exe - outpost是什么进程 有什么用
  • win7旗舰版怎么改成专业版
  • href中的?
  • 使用Android Go的手机
  • vue router 传参
  • javascript如何
  • js dom操作方法
  • css实现无缝滚动
  • 民办非企业单位登记管理暂行条例
  • 单张发票开票限额?
  • 广东电子税务局官网登录入口
  • 厦门市无纸化税务局官网
  • 袁野近照
  • 2020年砂石
  • 租赁发票交多少税费
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设