位置: 编程技术 - 正文

Python实现以时间换空间的缓存替换算法

编辑:rootadmin

推荐整理分享Python实现以时间换空间的缓存替换算法,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

缓存是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速度很快。缓存就是把一些数据暂时存放于某些地方,可能是内存,也有可能硬盘。

在使用Scrapy爬网站的时候,产生出来的附加产物,因为在Scrapy爬取的时候,CPU的运行时间紧迫度不高(访问频次太高容易被封禁),借此机会难得来上一下,让自己的内存解放一下。

算法原理:

通过将要缓存的数据用二进制展开,得到的二进制数据映射到缓存字段上,要检验是否已经缓存过,仅需要去查找对应的映射位置即可,如果全部匹配上,则已经缓存。

# 二进制就是个二叉树# 如下面可以表示出来的数据有0, 1, 2, 3四个(两个树独立)

0 1/ / 0 1 0 1

因此对缓存的操作就转化为对二叉树的操作,添加和查找只要在二叉树上找到对应路径的node即可。

算法关键代码:

实际使用效果如何呢&#;

Python实现以时间换空间的缓存替换算法

在和Python默认的 set 相比较,得出测试结果如下(存取整型,不定长字符串,定长字符串):

测试下来,内存消耗控制的比较好,一直在字节,而是用 set 的内存虽然也不是很大,当相较于 ByteCache 来说,则大上很多。

但 ByteCache 的方式来缓存,最大的问题是当碰到非常大的随机数据时,消耗时间会比较惊人。如下面这种随机长度的字符串缓存测试结果:

在个数据中,添加消耗s,查找消耗s,而 set 接近于0,单条数据也需要ms(均值)才能完成读/写操作。

不过,正如开头说的,在紧迫度不是很高的Scrapy中,这个时间并不会太过于窘迫,更何况在Scrapy中,一般是用来缓存哈希后的数据,这些数据的一个重要特性是定长,定长在本缓存算法中还是表现不错的,在位长度的时候,均值才0.5ms。而与此同时倒是能在大量缓存的时候,释放出比较客观的内存。

如果有更好的缓存算法能让速度在上新台阶,也是无比期待的。。。

总结:

1. 此方法的目标是用时间换取空间,切勿在时间紧迫度高的地方使用

2. 非常适用于大量定长,且数据本身比较小的情况下使用

3. 接2,非常不建议在大量不定长的数据,而且数据本身比较大的情况下使用

以上内容是小编给大家介绍的Python实现以时间换空间的缓存替换算法,希望对大家有所帮助!

Python中使用OpenCV库来进行简单的气象学遥感影像计算 OpenCV的全称是OpenSourceComputerVisionLibrary,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究

使用C#配合ArcGIS Engine进行地理信息系统开发 简单的地图读取、展示终于到暑假了。。。开始认真整理整理相关学习的心得体会咯~先把很久之前挖的关于C#二次开发的坑给填上好了~这次先计划用一

Go语言基于Socket编写服务器端与客户端通信的实例 在golang中,网络协议已经被封装的非常完好了,想要写一个Socket的Server,我们并不用像其他语言那样需要为socket、bind、listen、receive等一系列操作头疼,

标签: Python实现以时间换空间的缓存替换算法

本文链接地址:https://www.jiuchutong.com/biancheng/382378.html 转载请保留说明!

上一篇:Python使用爬虫猜密码(pythone爬虫)

下一篇:Python中使用OpenCV库来进行简单的气象学遥感影像计算(python的opencv)

  • 认缴制股权转让印花税的计税依据是什么
  • 资产负债表债务法是什么意思
  • 公立幼儿园保育员好进吗
  • 收到红字进项发票需要认证么
  • 发票打印格式错误
  • 开户行为什么是中国建设银行总行
  • 本年利润结转在贷方表示什么意思
  • 个税申报包含哪些
  • 资本公积什么时候做账
  • 收到汇算清缴退税账务处理
  • 固定资产已入账怎么冲销
  • 第三方汽车贷款平台有哪些
  • 收到招聘通知
  • 公司支付员工团建费没有发票怎么录账
  • 招聘签合同
  • 增值税发票查验平台显示查无此票
  • 建筑业的一般纳税人
  • 电子产品企业用电量大吗
  • 有业务往来的两家公司可以投一个公司吗
  • 递延所得税资产借贷方向
  • 小规模税控盘服务费怎么填增值税申报表
  • 金税盘需要报税吗
  • 没有走公户的发票费用怎么做账
  • 坏账收回的会计处理方法
  • 应收账款零头没有收到如何账务处理
  • 三星笔记app功能介绍
  • 为什么电脑连上蓝牙耳机却是外放
  • php数组函数大全
  • bios怎么关
  • 公司logo设计费是业务宣传费吗
  • 存货周转率公式怎么算
  • 股东分配利润如何入账
  • 会计分录有哪几种形式
  • PHP:finfo_buffer()的用法_fileinfo函数
  • php二维码解码
  • echarts地图tooltip
  • php对接mysql
  • vue中事件
  • 每个开发人员都有编制吗
  • file读取文件内容
  • git t
  • 发票失控进项转出
  • 代收代缴水费可以加多少损耗
  • mysql @参数
  • 公司法人和经理的区别
  • 其他债权投资计提减值影响所有者权益吗
  • mysql查询字段为空的数据
  • 发票做账流程
  • 外购商品用于促销能抵扣吗
  • 扣除土地价款
  • 银行受理汇票贴现业务
  • 香港公司账户收美元要交税吗
  • 怎样才能制作出白瓷
  • 一个简单的微笑说说
  • sql实现分组查询的短语
  • linux实现mysql数据库每天自动备份定时备份
  • sqlserver判断数据库是否存在
  • mysql sql行转列
  • windows 开始
  • win10预览版选哪个
  • win10清理系统盘垃圾
  • 利用图片密码登录微信
  • linux快速查看目录大小
  • win7电脑耳机插上还是外放
  • linux硬盘找不到
  • android入门教程
  • pe,翻译
  • easyui combobox onchange
  • linux shell -s
  • python的linux
  • jquery给复选框赋值
  • jquery.handleerror
  • android基础入门教程
  • Android Studio --自动删除没有用的资源,给APK减减肥
  • Warning: Build-tool 17.0.0 is missing AAPT at F:adt-bundle-windows-x86sdk
  • 税务文书档案保管期限
  • 增值税税控系统专用设备及技术维护费
  • 消费税征税环节
  • 国家税务总局2011年34号公告
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设