位置: IT常识 - 正文

【实战分享】js生成word(docx),以及将word转成pdf解决方案分享(js技术干货分享)

编辑:rootadmin
【实战分享】js生成word(docx),以及将word转成pdf解决方案分享

推荐整理分享【实战分享】js生成word(docx),以及将word转成pdf解决方案分享(js技术干货分享),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:js 教程视频,js技巧,js教程免费视频,js入门视频,js技巧,js玩法,js技巧,js技巧,内容如对您有帮助,希望把文章链接给更多的朋友!

本文将记录如何用js生成word文件,并在node服务器端将word转换成pdf。记录的代码均是在真实业务场景中使用成功的代码,没有记录中间踩坑的过程。想直接抄答案的家人们可以跳转到1.2 程序编写部分,最终效果图可在1.2 程序编写部分中4. 效果展示模块查看。

如果有更好的解决方案,也欢迎大家在评论区讨论、分享~

本文demo存放地址:github.com/ChicKo1108/…

一、DocxTemplater:使用js生成word

老铁们,话不多说,先上链接:Docxtemplater | Word, Powerpoint, Excel generation using templates in your application | docxtemplater

DocxTemplater是一个基于模板生成最终文件的插件,它通过一个简单的{tag}语法将预设的数据填入模板Word或者Powerpoint中,帮助开发者快速生成最终文件。

由于DocxTemplater是基于{tag}变量替换,得到最终的文件,因此文件的样式是非常可控的。在开发过程中,设计师只需要出一版最终的成品word,开发者将内容替换成对应的{tag}即可(再也不用被设计师追着还原设计稿了!)。

DocxTemplater是一个收费的库,但是它拥有免费的开源版本,对于我所涉及的业务,使用免费版本完全可以解决。

开源版包括的功能包括:

{tag}替换条件判断循环图片渲染

除免费版外,它还拥有pro plan(950€ per\year)、Entreprise plan(24500€ per\year),具体功能大家可以前往官网查看。(但是白嫖的永远是最香的!)

由于我的业务只涉及生成word和pdf,所以本文只介绍word的相关内容,如果需要处理ppt,大家可前往官网自行学习。

1.1 模板语法

在了解模板语法之前,我们需要先创建一个tempalte.docx模板文件。

变量替换

变量使用{key}标签,在tempalte.docx文件中输入以下模板:

Hello, my name is {name}.

然后准备以下数据:

let data = { name: "千万",}

最终我们生成的docx文件将会是:

Hello, my name is 千万.条件判断

条件判断使用{#key}开始,使用{/key}结束,最简单的用法是使用Boolean类型数据进行填充。

Hello, my name is {name}.{#hasAge}I'm {age} years old.{/hasAge}{#hasWeight}My weight is {weight}.{/hasWeight}

然后准备以下数据:

let data = { name: "千万", hasAge: true, age: 23, hasWeight: false,}

最终我们生成的docx文件将会是:

Hello, my name is 千万.I'm 23 years old.

除了Boolean类型的数据以外,我们也可以填充其他类型:

type是否显示模块false / 空数组不显示非空数组显示,且将循环渲染内部元素对象显示,且使用对象内部变量替换{tag}其他真值显示

如果变量填充了数组,其实就是我们下面要介绍的循环语法,在下面一小节中再进行介绍。

在这里简单说一下填充对象的情况:

准备word模板如下:

总价格:{price}{#product} ${productName}: ${price} {/product}

准备数据如下:

let data = { price: 159, product: { productName: 'pencel', price: 1.2 }}

最终我们生成的docx文件将会是:

总价格:159pencel:$1.2 循环

循环的标志与条件判断相同,但对应的变量应使用Array来填充。

{#examScoreList} {exam}: {score}{/examScoreList} 【实战分享】js生成word(docx),以及将word转成pdf解决方案分享(js技术干货分享)

然后我们填充以下数据:

let data = { examScoreList: [ { exam: 数学, score: 60 }, { exam: 语文, score: 50 }, { exam: 英语, score: 40 }, ],}

最终我们生成的docx文件将会是:

数学: 60 语文: 50 英语: 40 表格循环

值得注意的是,循环不仅仅可以循环一段普通文字,我们也可以对表格进行循环,包括:循环行和循环整个表。如果想要循环渲染多个表格,只需要在表格外面使用循环语法即可,不在此处过多赘述。下面展示循环渲染一个表中的行的写法:

上图中可以看到,我在表格的第二行中使用了循环语法进行填写,这样我们最终生成的文档中,表头和尾就不会被循环,第二行将会被多次渲染,结果如下:

图片

图片使用{%image}进行标注即可,对于图片的数据传入需要特殊处理,后面的部分会进行介绍。

总结

根据以上语法,我们就可以准备对应的word模板文件了,大部分场景下应该都可以满足。在准备模板的时候,固定的文案和样式直接保留在文档中即可,包括页眉、页脚,各个段落的行距、间距,文字的字体、大小等。其他需要根据真实数据渲染的值,就用标签标注上。准备好模板文件以后,就可以开始脚本函数的编写了。

PS: 要善用表格进行排版布局!

1.2 程序编写安装所需库npm install docxtemplaternpm install docxtemplater-image-module-free // 图片模块,没有图片需求可以不装npm install pizzip // 处理模板文件用到,且只能使用该库 客户端生成1. 获取模板文件的binaryStringfunction getFileBinaryString(templateFile) { // templateFile是File对象 return new Promise((resolve, reject) => { const reader = new FileReader(); reader.onload = (e) => { resolve(e.target.result); } reader.onerror = reject; reader.readAsBinaryString(templateFile); });}

这里使用到了FileReader类,用于将模板文件转换为binaryString,需要注意浏览器的兼容性。

如果对兼容性有要求,可以是使用pizzip/utils中提供的方法getBinaryContent,但是此库对ts兼容性比较差,因此我在实际代码中使用了FileReader。

import PizZipUtils from "pizzip/utils/index.js";function loadFile(url, callback) { PizZipUtils.getBinaryContent(url, callback); } 2. 生成最终文件(无需图片)// generate-doxc.jsimport PizZip from 'pizzip';import DocxTemplater from 'docxtemplater';function getFileBinaryString(templateFile) { return new Promise((resolve, reject) => { const reader = new FileReader(); reader.onload = (e) => { resolve(e.target.result); } reader.onerror = reject; reader.readAsBinaryString(templateFile); });}export async function generateDocxFile(template, fileData) { return new Promise((resolve, reject) => { getFileBinaryString(template) .then(templateData => { const zip = new PizZip(templateData); const doc = new DocxTemplater() .loadZip(zip) .render(fileData); // fileData是我们需要定义好,传给docxtempale的数据。 const out = doc.getZip().generate({ type: 'blob', mimeType: 'application/vnd.openxmlformats-officedocument.wordprocessingml.document', }); resolve(out); }) .catch(reject); });} 3. 准备数据,生成最终文件

接下来我们准备一个<input type="file" />的文件输入框(你也可以使用网络请求,或者任何方式拿到文件,只要最终获得二进制数据就可以),用来获取模板文件。同时准备好相应的数据,来对模板进行填充。

// App.jsximport { saveAs } from 'file-saver';import { generateDocxFile } from './utils/generate-docx';const fileData = { intro: '国际劳动节,又称五一国际劳动节、劳动节、国际示威游行日,是纪念工人和劳工运动的斗争和成果的日子。国际劳动节是一项由国际劳工运动所推动的节日,全世界劳工和工人阶级在一般会在五朔节(5月1日)举行的庆祝节日,而美国和加拿大在9月第一个星期一举行。是世界上80多个国家的劳动节。', activities: [ { name: '阿尔及利亚', activity: '在阿尔及利亚,5月1日是公共假日,以庆祝劳动节。' }, { name: '安哥拉', activity: '5月1日在安哥拉被承认为公共假日,称为劳动节。' }, { name: '埃及', activity: '在埃及,5月1日被称为劳动节,是一个带薪的公共假期。在传统上,埃及总统会主持正式的五一节庆祝活动。' }, { name: '加纳', activity: '5月1日是加纳的一个节日,属于庆祝全国所有工人。工会和劳工协会以游行的形式来庆祝劳动节。加纳也会举行阅兵式,通常由工会大会秘书长和各地区的区域秘书致辞。来自不同工作地点的工人通过条幅和衣着表明他们的公司。' } ]}function App() { const handleFileChange = async (e) => { const file = e.target.files[0]; const out = await generateDocxFile(file, fileData); saveAs(out, `${new Date().getTime()}.docx`); } return ( <div className="App"> <input type="file" onChange={handleFileChange} /> </div> )}export default App; 4. 效果展示

模板文件如下:

生成结果如下:

5. 图片处理

如果需要在模板中使用图片,我们需要安装docxtemplater-image-module-free模块。

引入了此模块后,需要在加载模板文件后,载入image模块,然后异步填入数据。

// generate-docx.js// 将图片处理为base64,给模板使用function convertImgToBase64(url, outputFormat) { return new Promise((resolve, reject) => { let canvas = document.createElement( 'CANVAS', ); const ctx = canvas.getContext('2d'), img = new Image(); img.crossOrigin = 'Anonymous'; img.onload = function () { canvas.height = img.height; canvas.width = img.width; ctx.drawImage(img, 0, 0); var dataURL = canvas.toDataURL(outputFormat || 'image/png'); canvas = null; resolve(dataURL); }; img.onerror = function (e) { reject(e); }; img.src = url; });}const imageOpts = { // 图片的配置 centered: false, getImage: function (tagValue, tagName) { // 将图片转成base64 return new Promise((resolve) => { if (typeof tagValue === 'string' && base64Regex.test(tagValue)) { return resolve(tagValue); } else { convertImgToBase64(tagValue).then((base64) => { return resolve(base64Parser(base64)); }); } }); }, // 设置图片宽高,可以根据tagName为每一张图片设置不同宽高 getSize: function (img, tagValue, tagName) { // img是图片Buffer,tagValue是图片初始值,tagName是图片在模板中定义的标签key值 return [150, 150]; // [宽, 高] }};export async function generateDocxFile(template, fileData) { return new Promise((resolve, reject) => { getFileBinaryString(template) .then(templateData => { const zip = new PizZip(templateData); const doc = new DocxTemplater() .loadZip(zip) .attachModule(new ImageModule(imageOpts)) // 载入模块 .compile(); // 异步填充数据 doc.resolveData(fileData) .then(() => { doc.render(); const out = doc.getZip().generate({ type: 'blob', mimeType: 'application/vnd.openxmlformats-officedocument.wordprocessingml.document', }); docxLists.push({ file: out, fileName }); resolve(); }); }) .catch(reject); });}

对于有图片的文档生成,需要异步载入数据,且图片数据需要处理为base64,上述代码给出了处理图片的一种解决方案,如果大家有更高效的方法也可以自行使用。

node服务器端生成

该库同样支持在node中使用,其思想与在浏览器端基本一致,在node端可以直接使用buffer,下面贴出官方给出的代码示例。

const PizZip = require("pizzip");const Docxtemplater = require("docxtemplater"); const fs = require("fs");const path = require("path"); // Load the docx file as binary contentconst content = fs.readFileSync( path.resolve(__dirname, "input.docx"), "binary" );const zip = new PizZip(content);const doc = new Docxtemplater(zip,{ paragraphLoop: true, linebreaks: true,}); // Render the document (Replace {first_name} by John, {last_name} by Doe, ...)doc.render({ first_name: "John", last_name: "Doe", phone: "0652455478", description: "New Website",});const buf = doc.getZip().generate({ type: "nodebuffer", // compression: DEFLATE adds a compression step. // For a 50MB output document, expect 500ms additional CPU time compression: "DEFLATE",});// buf is a nodejs Buffer, you can either write it to a file or res.send it with express for example.fs.writeFileSync(path.resolve(__dirname, "output.docx"), buf); 1.3 总结

docxTemplater是一个通过模板文件生成word的库,它能最大程度的保证最终生成的word的样式的完整和还原。代码搭建好后,对于类似的业务,开发者们只需要编写更多的模板文件,并且把精力集中在对数据的处理上即可。

配合e-charts或其他图表库,也可以让我们实现报表文件的生成。

此外,对于pizzip这个库,它本身是对jszip库的一个升级,拥有对zip文件的操作能力,可以直接解压或者生成zip包,我们可以直接通过此库对批量生成的文件进行打包处理,打包主要用的api如下:

const zip = new pizZip();zip.file(fileName, fileBuffer); // 生成的文件名 以及 文件的 arrayBufferzip.generate({ type: 'blob' }), `documents.zip`); // 生成zip文件 二、使用libre office将word转换成pdf

在进行此部分业务时,原本想在前端把所有的工作都做好,但是没有找到在客户端就直接转换的方法。因此,此部分在服务器端进行解决。

首先需要在机器上安装libre office软件,具体方法可以自行搜索。

安装好后,项目中安装libreoffice-convert库,这个库对libre office的转换方法进行了封装,直接调用其中方法就好:

const path = require('path');const fs = require('fs');const libre = require('libreoffice-convert');async function docx2pdf(docxBuf, outputPath) { libre.convert(docxBuf, '.pdf', undefined, (err, outputBuf) => { if (err) { console.log(`Error converting file: ${err}`); } fs.writeFileSync(outputPath, outputBuf); });}const inputBuf = fs.readFileSync(path.join(__dirname, 'sample.docx'));let outputPath = path.join(__dirname, 'sample.pdf');docx2pdf(inputBuf, outputPath);

如果是zip文件,同样可以安装jsZip或者pizZip进行解压、打包等处理。这里更推荐使用jsZip,因为文档更加丰富,且对ts支持更好。

三、结束语

这是我第二次遇到此类业务,所以本着学习、记录、分享的心态,将内容分享到平台上。在开发过程中遇到了很多“坑”,并没有在本文中记录。本文主要还是以记录最终成功的代码为主,把内容分享给其他有同样需求的家人们。毕竟轮子已经这么完善了,当然要好好利用啦!

本文链接地址:https://www.jiuchutong.com/zhishi/285141.html 转载请保留说明!

上一篇:东内格罗斯省沿海的鹦嘴鱼,菲律宾 (© Tim Fitzharris/Minden Pictures)(内格罗斯岛)

下一篇:最小的单电相机是什么(最小巧的单反相机)

  • python excel写入数据

    python excel写入数据

  • 小米手环2怎么调亮度(小米手环2怎么重新绑定手机)

    小米手环2怎么调亮度(小米手环2怎么重新绑定手机)

  • 屏蔽微信群消息但不退出群的方法是什么(屏蔽微信群消息后有人@我可以看到吗)

    屏蔽微信群消息但不退出群的方法是什么(屏蔽微信群消息后有人@我可以看到吗)

  • 麒麟810达到骁龙什么样的水平(麒麟810骁龙675哪个好)

    麒麟810达到骁龙什么样的水平(麒麟810骁龙675哪个好)

  • R17外屏玻璃碎了(r17pro换外屏视频)

    R17外屏玻璃碎了(r17pro换外屏视频)

  • igs文件用什么打开(igs文件怎么生成)

    igs文件用什么打开(igs文件怎么生成)

  • 华为手机拍摄屏幕有波纹(华为手机拍摄屏幕有波纹如何消除)

    华为手机拍摄屏幕有波纹(华为手机拍摄屏幕有波纹如何消除)

  • 拍摄的视频怎么加音乐(拍摄的视频怎么加速)

    拍摄的视频怎么加音乐(拍摄的视频怎么加速)

  • 手机成了安全模式怎么调回来(手机成了安全模式怎么退出)

    手机成了安全模式怎么调回来(手机成了安全模式怎么退出)

  • 为什么苹果手机安装的第三方软件是黑色的(为什么苹果手机wifi变成灰色按不了)

    为什么苹果手机安装的第三方软件是黑色的(为什么苹果手机wifi变成灰色按不了)

  • 美版苹果11pro是双卡吗(美版苹果11pro是单卡还是双卡)

    美版苹果11pro是双卡吗(美版苹果11pro是单卡还是双卡)

  • https采用什么加密协议

    https采用什么加密协议

  • gf940m显卡是什么水平(gf9400m显卡)

    gf940m显卡是什么水平(gf9400m显卡)

  • ios10有录屏功能吗(ios10的录屏功能在哪里设置)

    ios10有录屏功能吗(ios10的录屏功能在哪里设置)

  • uc普通会员多次云收藏是几次(3天uc会员)

    uc普通会员多次云收藏是几次(3天uc会员)

  • 天猫精灵cc支持微信视频吗(天猫精灵cc支持投屏吗)

    天猫精灵cc支持微信视频吗(天猫精灵cc支持投屏吗)

  • 如何解除微信绑定的手机号(如何解除微信绑定)

    如何解除微信绑定的手机号(如何解除微信绑定)

  • 显示器acin是啥意思(显示器a+a-什么意思)

    显示器acin是啥意思(显示器a+a-什么意思)

  • 手机怎么首选网络(手机怎样设置首选网络)

    手机怎么首选网络(手机怎样设置首选网络)

  • 小米手环4比3多哪些功能(小米手环4跟3的区别)

    小米手环4比3多哪些功能(小米手环4跟3的区别)

  • Linux下快速安装部署远程连接软件SSH的简明教程(linux如何安装)

    Linux下快速安装部署远程连接软件SSH的简明教程(linux如何安装)

  • 电脑用久了就会产生缓存垃圾有什么方法可以清理mac垃圾(电脑用久了会出现什么问题)

    电脑用久了就会产生缓存垃圾有什么方法可以清理mac垃圾(电脑用久了会出现什么问题)

  • win10待机唤醒后白屏怎么办(Win10待机唤醒后白屏怎么办)

    win10待机唤醒后白屏怎么办(Win10待机唤醒后白屏怎么办)

  • WordPress另一更新正在进行解决方法(wordpress自动更新)

    WordPress另一更新正在进行解决方法(wordpress自动更新)

  • 进口报关商品的完税价格包含运费吗
  • 个人取得上市公司股票期权个人所得税
  • 汇算清缴是不是按照审计报告
  • 现金流量表和利润表关系
  • 自产农产品增值税申报表填10行吗
  • 退回以前年度工资怎么做账
  • 企业停产多久算长期停产
  • 税控盘服务费去年忘记抵了今年可以抵扣吗
  • 民营企业的待遇
  • 进账单填错了用重新开转账支票吗
  • 法定盈余公积金的提取比例一般按照()
  • 商业汇票的申请人是谁
  • 收到承兑汇票怎么兑现步骤
  • 房地产行业增值税筹划
  • 交通费汇算清缴怎么做账
  • 部队收礼怎么处罚
  • 产值指的是财务报表哪个数值
  • 开具红字发票后发现购买方已做抵扣怎么办
  • 电子税务局社保申报截止日期每月
  • 事业单位取得的财政拨款免税吗
  • 计提了坏账准备对利润的影响
  • 公司账上没钱股东又不出资发工资怎么办
  • 所得税申报表中的营业成本包括费用吗
  • 工伤医疗费会计分录
  • 外资企业税率是多少
  • 危废处置怎么收费
  • .exe文件怎么打不开
  • 应交税金月底可以有余额吗
  • 合同作废印花税法规定
  • 提升一下网速
  • win10重置后能恢复吗
  • 股权收购特殊性税务处理案例
  • netsurf.exe - netsurf是什么进程 有什么用
  • lsalss.exe
  • pkjobs.exe - pkjobs是什么进程 有什么用
  • 销售商品收取的运费会计分录
  • 微信小程序前端源码
  • 使用二氧化碳灭火器时人应该站在什么位置
  • 长期股权投资资本化
  • 特定业务预缴
  • php字符串转换
  • js数组常用方法有哪几种
  • 自费出版违法吗
  • 应交税费月末要结平
  • 小规模纳税人免增值税的账务处理
  • dedecms转eyoucms
  • 用友t3的操作流程
  • sql2008数据库维护计划
  • 空白发票作废怎么处理
  • 经营性投资范畴
  • 外贸企业出口货物会计分录
  • 接受现金捐赠怎么做会计分录
  • 当月购买固定资产需要计提吗
  • 单位发给职工的餐费补贴我变卖了违法吗?
  • 房地产资质代办需要多少钱
  • 政府补助会计核算
  • 其他人挂靠公司交社保会计处理怎么做?
  • 销售边角废料属于什么
  • 股东退股如何清算
  • 税收分类编码填错有影响吗
  • 事业单位无形资产包括哪些
  • 购买设备的运费增值税计入成本吗
  • 跨年补提城建税
  • Win7 64位 mysql 5.7下载安装常见问题小结
  • linux安装iso软件
  • window10节电模式怎么关闭
  • win7旗舰版更改适配器没有蓝牙连接
  • windows8.1关机在哪
  • slee401.exe - slee401是什么进程 有什么用
  • win8的开始
  • 内存一次性读多少字节
  • 计算机图形学是什么专业
  • 第一次接触怎么形容
  • 带你了解处女座
  • 搭建简单的spike课程
  • unity备份工程
  • jquery ztree选中节点颜色
  • 哈尔滨出租车可以拼车吗
  • 国家税务局申报系统
  • 广西怎么查社保记录
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设