位置: 编程技术 - 正文
推荐整理分享使用 Node.js 对文本内容分词和关键词抽取(node.js怎么用),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:node.js怎么用,node.js怎么用,node.js使用教程,node.js使用教程,node.js deno,node.js 文件操作,node.js怎么用,node.js怎么用,内容如对您有帮助,希望把文章链接给更多的朋友!
在讨论技术前先卖个萌,吃货的世界你不懂~~
众成翻译的文章有 tag,用户可以基于 tag 来快速筛选感兴趣的文章,文章也可以依照 tag 关联来进行相关推荐。但是现在众成翻译的 tag 是在推荐文章的时候设置的,都是英文的,而且人工设置难免不规范和不完全。虽然发布文章后也可以人工编辑,但是我们也不能指望用户或管理员能够时时刻刻编辑出恰当的 tag,所以我们需要用工具来自动生成 tag。
在现在开源的分词工具里面,jieba是一个功能强大性能优越的分词组件,更幸运地是,它有 node 版本。
nodejieba 的安装和使用十分简单:
我们可以载入自己的字典,在字典里给每个词分别设置权重和词性:
编辑 user.uft8地瓜 n金箍 n棒就棒在 然后通过 nodejieba.load 加载字典。
除了分词以外,我们可以利用 nodejieba 提取关键词:
HTTP、HTTP/2与性能优化
本文的目的是通过比较告诉大家,为什么应该从HTTP迁移到HTTPS,以及为什么应该添加到HTTP/2的支持。在比较HTTP和HTTP/2之前,先看看什么是HTTP。
什么是HTTP
HTTP是在万维网上通信的一组规则。HTTP属于应用层协议,跑在TCP/IP层之上。用户通过浏览器请求网页时,HTTP负责处理请求并在Web服务器与客户端之间建立连接。
有了HTTP/2,不使用雪碧图、压缩、拼接,也可以提升性能。然而,这不代表不应该使用这些技术。不过这已经清楚表明了我们从HTTP/1.1移动到HTTP/2的必要性。`;
输出的结果类似下面这样:
我们添加一些新的关键词到字典里:
性能HTTP/2
输出结果如下:
在这个基础上,我们采用白名单的方式过滤出一些可以作为 tag 的词:
HTTP、HTTP/2与性能优化
本文的目的是通过比较告诉大家,为什么应该从HTTP迁移到HTTPS,以及为什么应该添加到HTTP/2的支持。在比较HTTP和HTTP/2之前,先看看什么是HTTP。
什么是HTTP
HTTP是在万维网上通信的一组规则。HTTP属于应用层协议,跑在TCP/IP层之上。用户通过浏览器请求网页时,HTTP负责处理请求并在Web服务器与客户端之间建立连接。
有了HTTP/2,不使用雪碧图、压缩、拼接,也可以提升性能。然而,这不代表不应该使用这些技术。不过这已经清楚表明了我们从HTTP/1.1移动到HTTP/2的必要性。`;
最后得到:
这就是我们想要的结果。
标签: node.js怎么用
本文链接地址:https://www.jiuchutong.com/biancheng/380812.html 转载请保留说明!友情链接: 武汉网站建设