位置: 编程技术 - 正文

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

发布时间:2024-02-26

推荐整理分享MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mysql开发工程师,mysql开发案例,mysql开发规范,mysql开发案例,mysql数据库开发技术,mysql 开发,mysql 开发,mysql开发规范,内容如对您有帮助,希望把文章链接给更多的朋友!

一、我们遇到了什么问题

在标准SQL里面,我们通常会写下如下的SQL insert语句。

很显然,在MYSQL中,这样的方式也是可行的。但是当我们需要批量插入数据的时候,这样的语句却会出现性能问题。例如说,如果有需要插入条数据,那么就需要有条insert语句,每一句都需要提交到关系引擎那里去解析,优化,然后才能够到达存储引擎做真的插入工作。

正是由于性能的瓶颈问题,MYSQL官方文档也就提到了使用批量化插入的方式,也就是在一句INSERT语句里面插入多个值。即,

这样的做法确实也可以起到加速批量插入的功效,原因也不难理解,由于提交到服务器的INSERT语句少了,网络负载少了,最主要的是解析和优化的时间看似增多,但是实际上作用的数据行却实打实地多了。所以整体性能得以提高。根据网上的一些说法,这种方法可以提高几十倍。

然而,我在网上也看到过另外的几种方法,比如说预处理SQL,比如说批量提交。那么这些方法的性能到底如何?本文就会对这些方法做一个比较。

二、比较环境和方法我的环境比较苦逼,基本上就是一个落后的虚拟机。只有2核,内存为6G。操作系统是SUSI Linux,MYSQL版本是5.6.。

可以想见,这个机子的性能导致了我的TPS一定非常低,所以下面的所有数据都是没有意义的,但是趋势却不同,它可以看出整个插入的性能走向。

由于业务特点,我们所使用的表非常大,共有个字段,且写满(每个字段全部填满,包括varchar)大致会有略小于4KB的大小,而通常来说,一条记录的大小也有3KB。

由于根据我们的实际经验,我们很肯定的是,通过在一个事务中提交大量INSERT语句可以大幅度提高性能。所以下面的所有测试都是建立在每插入条记录提交一次的做法之上。

最后需要说明的是,下面所有的测试都是通过使用MYSQL C API进行的,并且使用的是INNODB存储引擎。

三、比较方法

理想型测试(一)——方法比较

目的:找出理想情况下最合适的插入机制

关键方法:

1. 每个进/线程按主键顺序插入

2. 比较不同的插入方法

3. 比较不同进/线程数量对插入的影响

*“普通方法”指的是一句INSERT只插入一个VALUE的情况。

*“预处理SQL”指的是使用预处理MYSQL C API的情况。

* “多表值SQL(条)”是使用一句INSERT语句插入条记录的情况。为什么是条?后面的验证告诉了我们这样做性能最高。

结论,很显然,从三种方法的趋势上来看,多表值SQL(条)的方式最为高效。

理想型测试(二)——多表值SQL条数比较

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

很显然,在数据量提高的情况下,每条INSERT语句插入条记录的做法最为高效。

理想型测试(三)——连接数比较

结论:在2倍与CPU核数的连接和操作的时候,性能最高

一般性测试—— 根据我们的业务量进行测试

目的:最佳插入机制适合普通交易情况?

关键方法:

1. 模拟生产数据(每条记录约3KB)

2. 每个线程主键乱序插入

很显然,如果是根据主键乱序插入的话,性能会有直线下降的情况。这一点其实和INNODB的内部实现原理所展现出来的现象一致。但是仍然可以肯定的是,多表值SQL(条)的情况是最佳的。

压力测试

目的:最佳插入机制适合极端交易情况?

关键方法:

1. 将数据行的每一个字段填满(每条记录约为4KB)

2. 每个线程主键乱序插入

结果和我们之前的规律类似,性能出现了极端下降。并且这里验证了随着记录的增大(可能已经超过了一个page的大小,毕竟还有slot和page head信息占据空间),会有page split等现象,性能会下降。

四、结论

根据上面的测试,以及我们对INNODB的了解,我们可以得到如下的结论。

&#;采用顺序主键策略(例如自增主键,或者修改业务逻辑,让插入的记录尽可能顺序主键)

&#;采用多值表(条)插入方式最为合适

&#;将进程/线程数控制在2倍CPU数目相对合适

五、附录

我发现网上很少有完整的针对MYSQL 预处理SQL语句的例子。这里给出一个简单的例子。

c代码

标签: mysql数据库开发技术

本文链接地址:https://www.jiuchutong.com/biancheng/348969.html 转载请保留说明!

上一篇:Django+mysql配置与简单操作数据库实例代码(django使用mysql)

下一篇:Windows下MySQL5.7.18安装教程

  • 离职员工奖金发放规定
  • 城镇土地使用税的计算公式
  • 公司债券股票的投资组合思路
  • 资产负债表库存为负数怎么调整
  • 合伙企业法人股东
  • 事业单位装修费用
  • 企业年报社保都是0人的公司
  • 固定资产在现金流量表中的体现
  • 税务局代增值税专用发票冲红,如何重新申报退税
  • 施工企业挂靠账务处理怎么做
  • 资产负债表预收账款期末余额怎么算
  • 金融机构往来利息支出
  • 金蝶标准版结转损益发生错误
  • 增普票付款要不要从公户走?
  • 残疾人就业保障金怎么申报
  • 商场 折扣
  • 小规模纳税人怎么开增值税专用发票
  • 个人储蓄存款利率
  • 金税盘减免税款贷方余额
  • 已进行账务处理怎么处理
  • 免抵退税的范围
  • 向关联企业借款债资比
  • 小规模纳税人会计核算健全,能够提供准确
  • 旧物品翻新
  • 简易计税的方式
  • 享受企业所得税优惠政策的农产品初加工范围
  • 印花税怎么计提和结转
  • php利用数组完成党员信息表
  • ChatGLM-6B (介绍以及本地部署)
  • 筹建期如果是一般纳税人 专票以后可以留着抵扣吗
  • opencv 边缘
  • vue watcher
  • parted命令详解
  • PHP编写1+到100
  • php输出空格语句
  • 电子承兑汇票到期怎么收款
  • python concat函数用法
  • python condition条件变量
  • 加油发票怎么报税
  • 新办商贸企业是国企吗
  • 暂估成本账务处理
  • 公司开发新产品时,由管理层任命的
  • 出差补助是否计入工资总额
  • 工程奖金计入什么科目
  • 现金预算包括哪些内容,来源是什么
  • 长期的待摊费用包括哪些
  • 不是销售性质的工作
  • 购入的固定资产,其入账价值包括的内容有
  • 银行账户收到养老金怎么办
  • 同一控制下的企业合并和非同一控制下的企业合并的区别
  • 土地出让金如何核算
  • 公司转投资是什么意思
  • 多计费用以前年度损益调整账务处理
  • 就业中心办理退工
  • 行权期行权条件成就什么意思
  • 会计政策变更的追溯调整法和未来适用法
  • 外商投资企业和外商独资企业
  • 存储过程的定义及调用方法
  • win7的查看方式
  • linux的用法
  • centos查看当前yum源
  • winhost.exe - winhost是什么进程
  • windows8.1默认壁纸
  • win7系统电脑开不了机
  • win8无法更新到win10
  • cocos2d rpg
  • 怎么用unity做游戏
  • ubuntu 20.4安装
  • js实现隔行变色
  • html头像代码
  • python数据结构教程
  • 深入理解两个大计重要论断心得体会
  • boostrapping
  • node.js express中app.param的用法详解
  • jquery教程 csdn
  • 菜鸟教程安卓
  • jquery轮播图自动播放
  • unity官方插件
  • jquery的选择器都有哪些
  • 化妆品的消费税率为
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号