位置: 编程技术 - 正文

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

编辑:rootadmin
然而,微软sql server在处理这类索引时,有个重要的缺陷,那就是把本该编译成索引seek的操作编成了索引扫描,这可能导致严重性能下降 举个例子来说明问题,假设某个表T有索引 ( cityid, sentdate, userid), 现在有个分页列表功能,要获得大于某个多列复合索引V0的若干个记录的查询,用最简单表意的方式写出来就是 V >= V0, 如果分解开来,就是: cityid > @cityid0 or (cityid = @cityid0 and (sentdate > @sentdate0 or (sentdate = @sentdate0 and userid >= @userid0))), 当你写出上述查询时,你会期待sql server会自动的把上述识别为V >= V0类型的边界条件,并使用index seek操作来实施该查询。然而,微软的sql server (版)有一个重要缺陷(其他的sql server如何还不得知), 当它遇到这样sql时,sql server就会采用index scan来实施,结果是您建立好的索引根本就没有被使用,如果这个表的数据量很大,那所造成的性能下降是非常大的。 对于这个问题,我曾经提交给微软的有关人士,他们进一步要求我去一个正式的网站上去提交这个缺陷,我懒得去做。 不过,对这个缺陷,还是有个办法能够绕过去的,只要把上面给出的条件变变形,sql server还是能够变回到是用index seek, 而不是低性能的index scan. 具体请看我的英文原文吧(对不起了, 我一旦写了中文,就不想翻成英文,反过来也一样, 估计大家英文都还可以,实在不行的就看黑体部分吧, ): The seek predicate of the form "x > bookmark_of_x" is needed in paging related query. The compiler has no difficulty to parse it correctly if x is a single column index, or two columns index, however, if x is a three columns index or more, then the compiler will have a hard time to recognize it. This failure will result in that the seek predicate ended up in residue predicate, which results in a much worse execution plan. To illustrate the point, take a example, Create table A( a int, b int, c int, d float, primary key (a, b, c)) now check the plan for the query: select c, d from A where (a> or a= and (b > or b = and c > )) you can see a table scan op is used, and the Where clause ended up in residue predicate. However, if you rewrite the query in an equivalent form: select c, d from A where a> or a= and b > or a= and b= and c > Then the compiler can choose an index seek op, which is desired. The problem is, the compiler should be able to recognize the first form of seek predicate on multiple columns index, it saves the user from having to pay extra time to figure out a get-around, not to mention the first form is a more efficient form of same expression. 上面的问题,可以说是部分的绕过去了,但是,也有绕不过的时候,接着看下面一段: It looks like that sql server lacks a consept of vector bookmark, or vector comparison or whatever you like to call it. The workaround is not a perfect workaround. If sql server were to understand the concept of vector bookmark, then the following two would be the same in execution plan and performance: 1. select top(n) * from A where vectorIndex >= @vectorIndex 2. select * from A where vectorIndex >= @vectorIndex and vectorIndex <=@vectorIndexEnd -- @vectorIndexEnd corresponds to the last row of 1. However, test has shown that, the second statement takes far more time than the first statement, and sql server actually only seek to the begining of the vector range and scan to the end of the whole Index, instead of stop at the end of the vector range. Not only sql server compile badly when the vector bookmark has 3 columns, test has shown that even with as few as 2 columns, sql serer still can not correctly recognize this is actually a vector range, example: 3. select top () a, b, c, d from A where a> or a= and b > 4. select a, b, c, d from A where (a> or a= and b > ) and (a< or a= and b <= ), 上面两个查询实质相同(表中的数据刚好如此),并且给出同业的结果集,但是,3比4的速度要快的多,如果去看execution plan也证明3确实应当比4快. 也就是说, 即使在索引vectorIndex只含两列的情况下, sql server也无法正确的理解范围表达式 @vectorIndex0 < vectorIndex < @vectorIndex1, 它能把前半部分正确的解读为seek, 但是, 后半部分无法正确解读, 导致, sql server会一直扫描到整个表的末尾, 而不是在@vectorIndex1处停下来. 以下测试代码, 有兴趣的人可以拿去自己玩:

推荐整理分享多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序),希望有所帮助,仅作参考,欢迎阅读内容。

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

文章相关热门搜索词:多列索引和联合索引,多列复合索引的作用,复合索引顺序,单列索引和复合索引,多个列上创建复合索引,单列索引和复合索引,多列复合索引的作用,复合索引最多几个字段,内容如对您有帮助,希望把文章链接给更多的朋友!

sqlserver索引的原理及索引建立的注意事项小结 聚集索引,数据实际上是按顺序存储的,数据页就在索引页上。就好像参考手册将所有主题按顺序编排一样。一旦找到了所要搜索的数据,就完成了这

SQL Server数据库入门学习总结 一图胜十言:SQLServer数据库总结一个大概的总结经过一段时间的学习,也对数据库有了一些认识。数据库基本是由表,关系,操作组成;对于初学者首

sqlserver 索引的一些总结 1.1.1摘要如果说要对数据库进行优化,我们主要可以通过以下五种方法,对数据库系统进行优化。1.计算机硬件调优2.应用程序调优3.数据库索引优化4.SQL

标签: 复合索引顺序

本文链接地址:https://www.jiuchutong.com/biancheng/348160.html 转载请保留说明!

上一篇:SQL语句分组获取记录的第一条数据的方法(sql实现分组查询的短语)

下一篇:sqlserver索引的原理及索引建立的注意事项小结(sqlserver 索引)

  • 增值税税率是怎么规定的
  • 纳税筹划的方法有哪些
  • 调研费用怎么写
  • 利润是非限定净现值吗
  • 损益类科目是否可以转出
  • 微信支付属于现金嘛
  • 开发成本属于什么类账户
  • 小规模商贸公司没有进项可以开发票吗?
  • 固定资产用于集体福利也算经营管理需要吗
  • 社保基数与工资不符
  • 住宅小区共用部位有哪些
  • 商品流通企业应将当期已销商品的进价转入当期费用
  • 接受现金捐赠怎么写分录
  • 社会团体收到的投资款怎么入账
  • 出口退税金额和进项税额不一致
  • 叉车车船税每年都要交吗
  • 因公出差的人身故怎么办
  • 小规模纳税人购买货物怎么入账
  • 企业所得税季报人数怎么填
  • 增值税发票小数点后面小数不能打印
  • 材料成本的核算方法有哪些
  • ntfs磁盘压缩
  • mac如何修改图片像素大小
  • 会计折算是什么意思
  • 在win7系统中,添加打印机驱动程序
  • 要看网怎么找
  • 上年费用未计提
  • 增值税出口服务零税率
  • 资产划转的账务处理
  • 工程施工暂估成本的账务处理流程
  • 三元运算符判断闰年php
  • 海运发票模板
  • 转让旧固定资产增值税例题
  • 年底有留抵税额怎么结转
  • 固定资产清理税务处理
  • php日期时间函数
  • php获取并显示用户的用户名
  • 网络安全文章1000字
  • 稚晖君的学历
  • php如何上传1个g以上的文件
  • 董事长报销应该是怎样的流程
  • 冲减预提成本分录
  • wordpress标签tag文章
  • 个人独资企业所得税弥补亏损
  • vector 底层原理
  • 其他应收款抵货款怎么记账
  • 应交增值税为负数怎么处理
  • 小规模纳税人财务报表是按季还是按月申报
  • 周转材料包装箱属于存货分类的
  • 已核销的坏账又收回会计分录
  • 应交税金科目的核算
  • 驾驶员培训费纳税吗
  • 计提增值税如何计算
  • 软件购买商城
  • 医生规培补助
  • 预收工程款怎么做账
  • 小企业会计准则2023电子版
  • 申报和做账必须一致吗
  • 小型便利店靠什么进行营利
  • 临建费用包含在哪里
  • 免征企业所得税的有哪些行业
  • 职工福利费的好处
  • sqlserver批量备份数据库
  • windows任务管理器调用的方法
  • ubuntu rhythmbox乱码解决方法
  • mac怎么连接校园网wifi
  • linux 查看磁盘io繁忙
  • 访问win10
  • win7旗舰版系统激活密钥
  • win7 64位旗舰版电脑如何取消网页自动保存密码?win7取消自动保存网页密码的方法
  • 实例的英文
  • 使用文字输入
  • js的select
  • python字典有什么用
  • javascript有几种类型
  • 谷歌的全球化发展战略
  • 重庆市委常委是副部级干部吗?
  • 开普票需要提供合同吗
  • 贵阳税务官网登录
  • 新疆自治区国税局郑志全
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设