位置: 编程技术 - 正文

Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用)

编辑:rootadmin

推荐整理分享Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:node.js ts,node.js 怎么调用python接口,node.js怎么用,nodejs 调用python代码,node.js利用cas实现单点登录,node.js利用cas实现单点登录,node.js使用教程,node.js利用cas实现单点登录,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

当想用 nodejs 抓取一些网页 , 我第一反应想到的就是使用 http 模块 , 比如抓取百度首页:

但是 , 这仅限于简单地抓取 html , 有很大的局限性。

假如你想要的内容不在 html 里 , 而是 js 动态生成的 , 那 http 模块就不能满足你的需求了 ;

假如网页使 gbk 编码的 , 上述方法也不太好用了。

假如是 https 上述方法也要改一改了。

我渴望一个更强大 , 但使用起来也不麻烦的工具。

PhantomJs

用 PhantomJs 就可以解决上述问题。

PhantomJs 就是一个没有界面的浏览器。

Node.JS利用PhantomJs抓取网页入门教程(nodejs怎么使用)

安装

使用 cnpm 安装 PhantomJS 即可:

这里我没有选择全局安装 , 因为全局安装的话 , 别人使用我的源码的时候 , 不知道还有这么一个依赖 , 项目就跑不起来了。

如果你也选择局部安装 , 那么你需要在 package.json 里的 scripts 中加入一段 :

等下会用到这个的 , 到这里 , 安装算完成了。

写代码

我们新建一个文件 , 名字随意 , 这里我新建一个 main.js :

这里有个 webpage 模块 , 我们刚才明明没有这个模块 , 为什么能引用这个模块 &#;&#;&#;

当然不能引用 , 假如我们使用 node main.js 来跑这段代码 , 是跑不起来的 , 应该这样运行这段代码 :

这里的 npm run phantomjs 对应的就是前面我们在 package.json 里加入的那段命令 , 很方便吧 , 几乎和 http 模块一样方便。

page.content 就是 html 代码了 , 这个 page 对象还有很多的属性 , 功能更强大。

到这里 , 你就已经算入门了 , 想知道更多可以去 phantomjs 官网看看文档了。

总结

标签: nodejs怎么使用

本文链接地址:https://www.jiuchutong.com/biancheng/380793.html 转载请保留说明!

上一篇:详解Windows下安装Nodejs步骤(windows安装包下载)

下一篇:nodejs制作爬虫实现批量下载图片(node爬取数据)

  • 销售不动产税率9%还是5%
  • 实收资本印花税是营业账簿吗
  • 工会开户所需资料怎么写
  • 个体工商户怎么注销
  • 收到营业外收入流水账怎么做账
  • 个人转让房产两年内全额计税是什么意思
  • 上个月没有清卡,这个月可以抄税吗
  • 收到低值易耗品的专票但未付款
  • 增值税发票抵扣多少个点
  • 营改增后甲供材的涉税风险
  • 逾期还款银行罚息怎么算
  • 退回剩余的工程物资
  • 开出支票支付属于什么会计科目
  • 固定资产减值损失计入
  • 购置股权账务处理流程
  • 公司取得增值税怎么算
  • 营改增后建筑安装发票
  • 蔬菜批发公司销售蔬菜是否免税
  • 税会差异例子
  • 金税盘提示离线开票时间超限深圳
  • 预付款退回扣除什么意思
  • 资产负债表里的年初余额是什么意思
  • 为什么贷款利息变高了
  • 质保金算合同资产
  • 已经上传的红字怎么修改
  • 电脑屏发黄怎么调正常哪
  • 抵扣给供货商预缴税款
  • bios界面进入
  • PHP:xml_set_external_entity_ref_handler()的用法_XML解析器函数
  • macos big sur 电池
  • PHP:Memcached::deleteMultiByKey()的用法_Memcached类
  • 挂靠建筑公司没有票据怎么做账?
  • 家里有蟑螂怎么找到窝
  • 显示器有必要买240hz吗
  • 2020年前端面试
  • PHP:mcrypt_enc_get_algorithms_name()的用法_Mcrypt函数
  • 海关交税标准表
  • 黄石国家公园的建立意义
  • 多洛米蒂徒步线路
  • PHP 中TP5 Request 请求对象的实例详解
  • 购买财务软件的费用
  • 前端 自动化脚本 怎么写
  • php中的数据类型有哪些?
  • php怎么上传图片并保存到数据库
  • 购进来的样品怎么账务处理
  • 企业账户对私人账户转账多久到账
  • 在建工程完工后转入哪里
  • 残疾基金出什么科目
  • 5年前开的发票退货可以冲红吗?
  • 织梦网站怎么添加关键词
  • 餐饮服务规定
  • 疫情期间提涨薪合适吗
  • 劳务费发票是个人的吗
  • 金税卡就是税控盘吗
  • 契税和印花税的会计分录
  • 小规模纳税人劳务派遣可以差额征税吗
  • 融资租赁业务如何开展
  • 政府拆迁赔款会计上怎样做账
  • 财务费用手续费借贷方向
  • 业务招待费需附上清单
  • 暂估入库可以隔几个月再冲回吗
  • 销售发票已开进项发票未收到怎么处理?
  • 债务转实收资本的审批报告
  • mysql查询语句优先级
  • xp系统怎么删除系统
  • ubuntu系统怎样
  • ssd安装centos7
  • rtvscn95.exe - rtvscn95是什么进程 有什么用
  • c:windowssys:em32mtgyu.dll 内存分配访问无效的解决办法
  • rd命令是什么
  • unity shader lod
  • vuerouter嵌套路由
  • html标签页效果
  • 圣诞树代码html
  • jquery中获取元素的三种方法
  • python中lxml模块
  • 全面推进行政执法公示制度包含的主要内容有
  • 广东省东莞电子税局
  • 个人所得税怎么填写子女教育
  • 重庆市大足区迪涛中学那几个是尖子班
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设