位置: 编程技术 - 正文

教你用十行node.js代码读取docx的文本

编辑:rootadmin

推荐整理分享教你用十行node.js代码读取docx的文本,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近有一个case。需要去解析word文档。有两个需求,一个是将word文档转成PDF,一个是将word文档中的内容按照一定的规范读取到数据库中,去npm仓库找了大概有十几个包,发现主要是通过以下的方式来转换代码。

通过调用系统底层程序(比如说office)的API来转换; 通过模板,替换数据来实现生成PDF; 通过有些免费将word转成PDF的网站来实现将word转成PDF,比如docx-to-pdf;

后来退而求其次,想通过先将docx转成文字,发现了个textract的包。

当然也有缺点,不支持docx中的标题号,不支持图片等文件。

不怕死的我决定自己干这件事情。

介绍

其实docx就是一个zip包,然后封装了一些xml文件。可以直接将docx的包改后缀为.zip来打开观看。

教你用十行node.js代码读取docx的文本

进入word文件夹

里面有几个主要的文件。

document.xml 这个就是文档的主要内容 numbering.xml 这个就是标题号,以及标题号的一些属性 styles.xml 这个就是样式列表

打开document.xml 你就会发现,所有的文本都是用 <w:t>标签包着的。这个就是本文的关键

代码

首先,需要通过npm安装一个能查看zip文件的包:adm-zip;

然后,写下下列代码即可

最近正在用node.js去解析docx的工作。先将最简单的写在上面。回头有空再继续分享

最新更新

之前随手写的代码,今天测试发现用更新后的代码比源代码的效率提升十倍以上。

附上测试代码

总结

标签: 教你用十行node.js代码读取docx的文本

本文链接地址:https://www.jiuchutong.com/biancheng/376410.html 转载请保留说明!

上一篇:Nodejs 获取时间加手机标识的32位标识实现代码(nodejs获取当前时间)

下一篇:nodejs读写json文件的简单方法(必看)(nodejs读取文件和写文件的方法)

  • 个人所得税C表怎么填写
  • 亏损企业股权转让
  • 家里财产分割
  • 公司组织出去旅游主持词
  • 非正常户发票管理
  • 如何申报加计抵减
  • 小规模纳税人购置税控设备
  • 结汇收益怎么算
  • 物业公司收取供热管道内网的维护费用合理吗
  • 红字发票冲销的销项税怎么处理
  • 餐饮赠送菜品怎么说
  • 招标代理公司转让
  • 公司的样品一般怎么处理
  • 出口不退税怎么做账
  • 商业保险税前扣除限额
  • 策划费收费标准
  • 装修费税率是多少2021
  • 小区物业宿舍
  • 附加税交税依据
  • 存货的核算心得体会
  • 原始凭证填写错误,可撕毁重新编制一张
  • 合并往来分录
  • 编制会计报表利润表
  • pssvc.exe - pssvc是什么进程 有什么用
  • 公司有长期挂账的权利吗
  • 微软win11预览版
  • 电脑网络提示ip地址错误怎么办
  • 离职补偿金如何缴纳个人所得税?
  • 企业公益性捐赠扣除比例
  • 个税非居民是什么意思
  • 无花果的功效与作用对女人的好处
  • driver-e
  • php提示框
  • 若依框架前后端分离手机号登录
  • 税控系统维护费抵扣申报表怎么填
  • php数组内容替换
  • framework教程
  • 现金股利算负债吗
  • 所有者权益总计怎么算沙盘
  • 城镇土地使用税征收标准及计算方法
  • python中字符串与数字相乘的结果
  • MYSQL ERROR 1045 (28000): Access denied for user (using password: YES)问题的解决
  • sql server怎么恢复
  • 购买电脑一次性计入费用吗合理吗
  • 发票冲红重开,重开时是按新税率还是旧税率?
  • 住宿发票抵税
  • 税控盘开具增值税专用发票步骤
  • 房地产开发企业建造的商品房,在出售前
  • 疫情期间免征什么税
  • 母公司以房产投资子公司
  • 合同资产减值准备对应科目
  • 转让厂房如何缴纳土地增值税
  • 在建工程预付款怎么做账
  • 免抵税额和免抵退税额一样吗
  • 总账建账要建全部科目吗
  • 管理费怎么扣除
  • 如何在境外银行开户
  • mysql索引方式有哪些
  • Linux下mysql 5.6.17 安装图文教程
  • win2003进入安全模式
  • 在windows中打开一个窗口后
  • windows没网络是怎么回事
  • win10电脑出现invalid partition table怎么弄
  • linux系统讲解
  • 如何知道自己的邮箱号
  • remind32.exe - remind32是什么进程 有什么用
  • windowxp音量图标没了
  • 利用图片密码登录微信
  • cocos2dx游戏开发框架
  • python编程中的函数
  • shell脚本监听端口
  • jquery实现图片横向移动
  • android 多页面
  • 国家税务局总局网址
  • 中国有哪些自由贸易港
  • 地税局上班时间是几点
  • 税收通知
  • 上海市嘉定区税务局电话号码
  • 税务守信激励典型案例
  • 山东税务自然人注册怎么回事
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设