位置: 编程技术 - 正文

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

编辑:rootadmin

推荐整理分享MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mysql开发工程师,mysql开发案例,mysql开发规范,mysql开发案例,mysql数据库开发技术,mysql 开发,mysql 开发,mysql开发规范,内容如对您有帮助,希望把文章链接给更多的朋友!

一、我们遇到了什么问题

在标准SQL里面,我们通常会写下如下的SQL insert语句。

很显然,在MYSQL中,这样的方式也是可行的。但是当我们需要批量插入数据的时候,这样的语句却会出现性能问题。例如说,如果有需要插入条数据,那么就需要有条insert语句,每一句都需要提交到关系引擎那里去解析,优化,然后才能够到达存储引擎做真的插入工作。

正是由于性能的瓶颈问题,MYSQL官方文档也就提到了使用批量化插入的方式,也就是在一句INSERT语句里面插入多个值。即,

这样的做法确实也可以起到加速批量插入的功效,原因也不难理解,由于提交到服务器的INSERT语句少了,网络负载少了,最主要的是解析和优化的时间看似增多,但是实际上作用的数据行却实打实地多了。所以整体性能得以提高。根据网上的一些说法,这种方法可以提高几十倍。

然而,我在网上也看到过另外的几种方法,比如说预处理SQL,比如说批量提交。那么这些方法的性能到底如何?本文就会对这些方法做一个比较。

二、比较环境和方法我的环境比较苦逼,基本上就是一个落后的虚拟机。只有2核,内存为6G。操作系统是SUSI Linux,MYSQL版本是5.6.。

可以想见,这个机子的性能导致了我的TPS一定非常低,所以下面的所有数据都是没有意义的,但是趋势却不同,它可以看出整个插入的性能走向。

由于业务特点,我们所使用的表非常大,共有个字段,且写满(每个字段全部填满,包括varchar)大致会有略小于4KB的大小,而通常来说,一条记录的大小也有3KB。

由于根据我们的实际经验,我们很肯定的是,通过在一个事务中提交大量INSERT语句可以大幅度提高性能。所以下面的所有测试都是建立在每插入条记录提交一次的做法之上。

最后需要说明的是,下面所有的测试都是通过使用MYSQL C API进行的,并且使用的是INNODB存储引擎。

三、比较方法

理想型测试(一)——方法比较

目的:找出理想情况下最合适的插入机制

关键方法:

1. 每个进/线程按主键顺序插入

2. 比较不同的插入方法

3. 比较不同进/线程数量对插入的影响

*“普通方法”指的是一句INSERT只插入一个VALUE的情况。

*“预处理SQL”指的是使用预处理MYSQL C API的情况。

* “多表值SQL(条)”是使用一句INSERT语句插入条记录的情况。为什么是条?后面的验证告诉了我们这样做性能最高。

结论,很显然,从三种方法的趋势上来看,多表值SQL(条)的方式最为高效。

理想型测试(二)——多表值SQL条数比较

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

很显然,在数据量提高的情况下,每条INSERT语句插入条记录的做法最为高效。

理想型测试(三)——连接数比较

结论:在2倍与CPU核数的连接和操作的时候,性能最高

一般性测试—— 根据我们的业务量进行测试

目的:最佳插入机制适合普通交易情况?

关键方法:

1. 模拟生产数据(每条记录约3KB)

2. 每个线程主键乱序插入

很显然,如果是根据主键乱序插入的话,性能会有直线下降的情况。这一点其实和INNODB的内部实现原理所展现出来的现象一致。但是仍然可以肯定的是,多表值SQL(条)的情况是最佳的。

压力测试

目的:最佳插入机制适合极端交易情况?

关键方法:

1. 将数据行的每一个字段填满(每条记录约为4KB)

2. 每个线程主键乱序插入

结果和我们之前的规律类似,性能出现了极端下降。并且这里验证了随着记录的增大(可能已经超过了一个page的大小,毕竟还有slot和page head信息占据空间),会有page split等现象,性能会下降。

四、结论

根据上面的测试,以及我们对INNODB的了解,我们可以得到如下的结论。

&#;采用顺序主键策略(例如自增主键,或者修改业务逻辑,让插入的记录尽可能顺序主键)

&#;采用多值表(条)插入方式最为合适

&#;将进程/线程数控制在2倍CPU数目相对合适

五、附录

我发现网上很少有完整的针对MYSQL 预处理SQL语句的例子。这里给出一个简单的例子。

c代码

标签: mysql数据库开发技术

本文链接地址:https://www.jiuchutong.com/biancheng/348969.html 转载请保留说明!

上一篇:Django+mysql配置与简单操作数据库实例代码(django使用mysql)

下一篇:Windows下MySQL5.7.18安装教程

  • 收到现金分红的会计分录
  • 人工费用的核算例题
  • 管理费用借贷方都有,如何结转
  • 5000以下固定资产怎么做账
  • 应交税费增值税明细账
  • 微商怎么交易流程
  • 集团内部公司之间怎么称呼
  • 预提费用所得税前扣除
  • 软件开发成本核算模板
  • 简易计税项目税金要计入成本吗
  • 研发过程中材料费计入
  • 交车辆购置税可以刷信用卡吗
  • 去年支付的费用今年取得发票
  • 金税三期申报代扣代缴增值税流程步骤分析
  • 运费单是什么
  • 社保费用可以税前扣除吗
  • 软件企业两免三减半税收政策到期
  • 总分机构如何做账
  • 《减免所得税优惠明细表》
  • 如何防止虚开发票 等舞弊行为?
  • 收购公司收购款转给谁
  • 增值税完税凭证怎么做账
  • 个人可以做代理吗
  • 小微企业文化事业建设费是否可以享受减免
  • 薪酬支出包括什么
  • linux常用命令详解
  • 非房地产企业的基建管理办法
  • 纳税申报怎么做
  • 怎么实现增删改查
  • 公司用车车祸一般谁负责
  • 代理公司变更地址多少钱
  • 计提税金及附加怎么算
  • kaggle如何入门
  • 冲销进项税
  • php 解析
  • echarts中国地图代码
  • php zmq
  • handsome主题破解
  • java上界通配符Animal Dog
  • 资产总额不超过5000万是指全年平均收入吗
  • sql server 2008r
  • 收到的销项负数发票如何申报
  • 已经抵扣的发票红字信息表怎么开
  • 年初未分配利润在借方表示什么
  • 事务所的账务处理
  • 营销策划合作协议
  • mongodb数据库语句
  • 农机合作社项目申报方案
  • 用友软件操作流程图片
  • 资产负债表应交税费是负数正常吗
  • 商业保理怎么账务处理?
  • 疫情期间社保减免优惠政策几个月
  • 自然灾害的原因有哪些
  • 长期股权投资的初始投资成本
  • 公司员工入职的心得体会
  • 出口未申报退税罚款多少
  • 外购货物用于在建工程分录
  • 营业外支出为负数原因
  • 未分配利润如何计算
  • 久期缺口计算公式解析
  • mysql错误处理
  • ubuntu无法进入系统出现uid121
  • solaris11.4安装教程
  • win8系统升级
  • CentOS 6.2(32位/64位) 安装步骤图文详解
  • xp怎么安全模式
  • NJeeves.exe - NJeeves进程文件是什么意思 有什么用
  • win7系统的电脑能装win10吗
  • window10删除自带输入法
  • 特牛的群名
  • html常用字符
  • 如何将位置信息生成二维码
  • Javascript字符串出现次数
  • python中json的用法
  • 如何搭建python项目架构
  • 土地增值税按什么价格
  • 北京社保退保手续办理
  • 增值税归国家还是地方
  • 环保税的税率是怎么算的
  • 税务登记证发证机关名称
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设