位置: 编程技术 - 正文

Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用)

编辑:rootadmin

推荐整理分享Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node.js ts,node.js 怎么调用python接口,node.js怎么用,nodejs 调用python代码,node.js利用cas实现单点登录,node.js利用cas实现单点登录,node.js使用教程,node.js利用cas实现单点登录,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

当想用 nodejs 抓取一些网页 , 我第一反应想到的就是使用 http 模块 , 比如抓取百度首页:

但是 , 这仅限于简单地抓取 html , 有很大的局限性。

假如你想要的内容不在 html 里 , 而是 js 动态生成的 , 那 http 模块就不能满足你的需求了 ;

假如网页使 gbk 编码的 , 上述方法也不太好用了。

假如是 https 上述方法也要改一改了。

我渴望一个更强大 , 但使用起来也不麻烦的工具。

PhantomJs

用 PhantomJs 就可以解决上述问题。

PhantomJs 就是一个没有界面的浏览器。

Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用)

安装

使用 cnpm 安装 PhantomJS 即可:

这里我没有选择全局安装 , 因为全局安装的话 , 别人使用我的源码的时候 , 不知道还有这么一个依赖 , 项目就跑不起来了。

如果你也选择局部安装 , 那么你需要在 package.json 里的 scripts 中加入一段 :

等下会用到这个的 , 到这里 , 安装算完成了。

写代码

我们新建一个文件 , 名字随意 , 这里我新建一个 main.js :

这里有个 webpage 模块 , 我们刚才明明没有这个模块 , 为什么能引用这个模块 &#;&#;&#;

当然不能引用 , 假如我们使用 node main.js 来跑这段代码 , 是跑不起来的 , 应该这样运行这段代码 :

这里的 npm run phantomjs 对应的就是前面我们在 package.json 里加入的那段命令 , 很方便吧 , 几乎和 http 模块一样方便。

page.content 就是 html 代码了 , 这个 page 对象还有很多的属性 , 功能更强大。

到这里 , 你就已经算入门了 , 想知道更多可以去 phantomjs 官网看看文档了。

总结

标签: nodejs怎么使用

本文链接地址:https://www.jiuchutong.com/biancheng/380793.html 转载请保留说明!

上一篇:详解Windows下安装Nodejs步骤(windows安装包下载)

下一篇:nodejs制作爬虫实现批量下载图片(node爬取数据)

  • 纳税人为风险纳税人
  • 将房产以股权形式出售
  • 工程款增值税专用发票如何开具
  • 公司购买食品如何入账
  • 免税农产品发票需要勾选吗
  • 企业进项发票不够销项开的多
  • 土地转让的税费怎么算
  • 企业职工保险如何转灵活就业
  • 营改增后怎么计算税费
  • 个人转让著作权所得免征个人所得税吗
  • 税收滞纳金什么意思
  • 购入货物自用的进项税额转出分录怎么处理
  • 购货方非增值税一般纳税人
  • 社会保险基金管理局是干什么的
  • 2021年2月适合公司开业的日子
  • 税控盘维护费是普票能全额抵扣吗
  • 企业增值税税负率与利润率的关系
  • 虚开进项税额转出会计分录
  • 信用减值损失编码
  • 监理费该谁出
  • 收入与成本不匹配建议怎么写
  • 制造企业享受增值税政策
  • 工业企业和其他企业经营的对象
  • 对赌协议的账务处理流程
  • windows10桌面右键没反应
  • 检验费用会计分录
  • 扣扣斗图在哪里设置
  • intel me有什么用
  • 分期摊销法计算公式
  • 国地税合并有什么角度写论文
  • 保险公司应收账款管理现状及存在的问题
  • 培训费收入交什么税
  • 若依框架和jeesite
  • php session_start
  • php实现用户登录
  • 莱达尔湖, 英格兰坎布里亚郡湖区 (© Tranquillian1/iStock/Getty Images Plus)
  • php session_id
  • 最简单的上传php文件
  • vue中 router.beforeEach() 的用法
  • 代垫运费算收入吗
  • 2021前端热门技术解读
  • 简要说说vue是什么?有什么主要的特性?
  • linux进程状态有哪些
  • php原生导出excel表单元格格式
  • ps打不出字怎么回事
  • 地方水利建设基金的会计分录
  • 酒店的销售费用和管理费用如何进行区分
  • 其他应付款怎么做账
  • PostgreSQL中使用dblink实现跨库查询的方法
  • 电力安装有前途吗
  • 固定资产折旧的账务处理
  • 开票信息修改
  • 股东的报销款可以抵投资款吗
  • 企业期末预收账款怎么算
  • 房地产企业固定资产贷款
  • 员工出差托运行李怎么办
  • 存货毁损损失应计入的科目是
  • mysql2003错误如何解决10061
  • mysql数据监控
  • 史上最快的速度
  • win10预览版和正式版区别
  • winole.exe - winole是什么进程
  • linux进程和线程底层实现原理一样吗
  • centos7.6忘记密码了怎么办
  • win系统开发
  • linux常用命令清除
  • win8纯净版32位
  • win7电脑无限蓝屏怎么解决
  • javascript Function函数理解与实战
  • 怎样用在js中使用css的内容
  • xcode怎么新建项目
  • linux常用shell操作指令
  • javascript入门教程
  • jquery 图片
  • python的argparse用法
  • javascript中如何获取元素?
  • 山西省国家税务局王旭斌局长
  • 县级税务
  • 税务局打印申报表
  • 在深圳月薪8000是什么水平
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设