位置: 编程技术 - 正文

sqlserver 索引的一些总结(sqlserver索引类型区别)

编辑:rootadmin
1.1.1 摘要 如果说要对数据库进行优化,我们主要可以通过以下五种方法,对数据库系统进行优化。 1. 计算机硬件调优 2. 应用程序调优 3. 数据库索引优化 4. SQL语句优化 5. 事务处理调优 在本篇博文中,我们将想大家讲述数据库中索引类型和使用场合,本文以SQL Server为例,对于其他技术平台的朋友也是有参考价值的,只要替换相对应的代码就行了! 索引使数据库引擎执行速度更快,有针对性的数据检索,而不是简单地整表扫描(Full table scan)。 为了使用有效的索引,我们必须对索引的构成有所了解,而且我们知道在数据表中添加索引必然需要创建和维护索引表,所以我们要全局地衡量添加索引是否能提高数据库系统的查询性能。 在物理层面上,数据库有数据文件组成,而这些数据文件可以组成文件组,然后存储在磁盘上。每个文件包含许多区,每个区的大小为K由八个物理上连续的页组成(一个页8K),我们知道页是SQL Server数据库中的数据存储的基本单位。为数据库中的数据文件(.mdf 或 .ndf)分配的磁盘空间可以从逻辑上划分成页(从0到n连续编号)。 页中存储的类型有:数据,索引和溢出。 文件和文件组 在SQL Server中,通过文件组这个逻辑对象对存放数据的文件进行管理。 1.1.2 正文 在物理层面上,数据库有数据文件组成,而这些数据文件可以组成文件组,然后存储在磁盘上。每个文件包含许多区,每个区的大小为K由八个物理上连续的页组成(一个页8K),我们知道页是SQL Server数据库中的数据存储的基本单位。为数据库中的数据文件(.mdf 或 .ndf)分配的磁盘空间可以从逻辑上划分成页(从0到n连续编号)。 页中存储的类型有:数据,索引和溢出。 文件和文件组 在SQL Server中,通过文件组这个逻辑对象对存放数据的文件进行管理。

图1数据库文件组织 在顶层是我们的数据库,由于数据库是由一个或多个文件组组成,而文件组是由一个或多个文件组成的&#;&#;逻辑组,所以我们可以把文件组分散到不同的磁盘中,使用户数据尽可能跨越多个设备,多个I/O 运转,避免 I/O 竞争,从而均衡I/O负载,克服访问瓶颈。 区和页 如图2所示,文件是由区组成的,而区由八个物理上连续的页组成,由于区的大小为K,所以每当增加一个区文件就增加K。

图2文件组成 页中保存的数据类型有:表数据、索引数据、溢出数据、分配映射、页空闲空间、索引分配等,具体如下图所示:

页类型

内容

Data

当 text in row 设置为 ON 时,包含除 text、 ntext、image、nvarchar(max)、varchar(max)、varbinary(max) 和 xml 数据之外的所有数据的数据行。

Index

索引条目。

Text/Image

大型对象数据类型:text 、 ntext、image、nvarchar(max)、varchar(max)、varbinary(max) 和 xml 数据。数据行超过 8 KB 时为可变长度数据类型列:varchar 、nvarchar、varbinary 和 sql_variant

Global Allocation Map、Shared Global Allocation Map

有关区是否分配的信息。

Page Free Space

有关页分配和页的可用空间的信息。

Index Allocation Map

有关每个分配单元中表或索引所使用的区的信息。

Bulk Changed Map

有关每个分配单元中自最后一条 BACKUP LOG 语句之后的大容量操作所修改的区的信息。

Differential Changed Map

有关每个分配单元中自最后一条 BACKUP DATABASE 语句之后更改的区的信息。

表1页中保存的数据类型 在数据页上,数据行紧接着页头(标头)按顺序放置;页头包含标识值,如页码或对象数据的对象ID;数据行持有实际的数据;最后,页的末尾是行偏移表,对于页中的每一行,每个行偏移表都包含一个条目,每个条目记录对应行的第一个字节与页头的距离,行偏移表中的条目的顺序与页中行的顺序相反。

图3数据页 索引的基本结构 “索引(Index)提供查询的速度”这是对索引的最基本的解释,接下来我们将通过介绍索引的组成,让大家对索引有更深入的理解。 索引是数据库中的一个独特的结构,由于它保存数据库信息,那么我们就需要给它分配磁盘空间和维护索引表。创建索引并不会改变表中的数据,它只是创建了一个新的数据结构指向数据表;打个比方,平时我们使用字典查字时,首先我们要知道查询单词起始字母,然后翻到目录页,接着查找单词具体在哪一页,这时我们目录就是索引表,而目录项就是索引了。 当然,索引比字典目录更为复杂,因为数据库必须处理插入,删除和更新等操作,这些操作将导致索引发生变化。 叶节点 假设我们磁盘上的数据是物理有序的,那么数据库在进行插入,删除和更新操作时,必然会导致数据发生变化,如果我们要保存数据的连续和有序,那么我们就需要移动数据的物理位置,这将增大磁盘的I/O,使得整个数据库运行非常缓慢;使用索引的主要目的是使数据逻辑有序,使数据独立于物理有序存储。 为了实现数据逻辑有序,索引使用双向链表的数据结构来保持数据逻辑顺序,如果要在两个节点中插入一个新的节点只需修改节点的前驱和后继,而且无需修改新节点的物理位置。 双向链表(Doubly linked list)也叫双链表,是链表的一种,它的每个数据结点中都有两个指针,分别指向直接后继和直接前驱。所以,从双向链表中的任意一个结点开始,都可以很方便地访问它的前驱结点和后继结点。 理论上说,从双向链表中删除一个元素操作的时间复杂度是O(1),如果希望删除一个具体有给定关键字的元素,那么最坏的情况下的时间复杂度为O(n)。 在删除的过程中,我们只需要将要删除的节点的前节点和后节点相连,然后将要删除的节点的前节点和后节点置为null即可。 图4索引的叶节点和相应的表数据 如上图4所示,索引叶节点包含索引值和相应的RID(ROWID),而且叶节点通过双向链表有序地连接起来;同时我们主要到数据表不同于索引叶节点,表中的数据无序存储,它们不全是存储在同一表块中,而且块之间不存在连接。 总的来说,索引保存着具体数据的物理地址值。 索引的类型 我们知道索引的类型有两种:聚集索引和非聚集索引。 聚集索引:物理存储按照索引排序。 非聚集索引:物理存储不按照索引排序。 聚集索引 聚集索引的数据页是物理有序地存储,数据页是聚集索引的叶节点,数据页之间通过双向链表的形式连接起来,而且实际的数据都存储在数据页中。当我们给表添加索引后,表中的数据将根据索引进行排序。 假设我们有一个表T_Pet,它包含四个字段分别是:animal,name,sex和age,而且使用animal作为索引列,具体SQL代码如下: ----------------------------------------------------------- ---- Insert data into data table. ----------------------------------------------------------- 图5聚集索引 如上图5所示,从左往右的第一和第二层是索引页,第三层是数据页(叶节点),数据页之间通过双向链表连接起来,而且数据页中的数据根据索引排序;假设,我们要查找名字(name)为Xnnbqba的动物Ifcey,这里我们以animal作为表的索引,所以数据库首先根据索引查找,当找到索引值animal = ‘Ifcey时,接着查找该索引的数据页(叶节点)获取具体数据。具体的查询语句如下: 当我们执行完SQL查询计划时,把鼠标指针放到“聚集索引查找”上,这时会出现如下图信息,我们可以查看到一个重要的信息Logical Operation——Clustered Index Seek,SQL查询是直接根据聚集索引获取记录,查询速度最快。

图6查询计划 从下图查询结果,我们发现查询步骤只有2步,首先通过Clustered Index Seek快速地找到索引Ifcey,接着查询索引的叶节点(数据页)获取数据。 查询执行时间:CPU 时间= 0 毫秒,占用时间= 1 毫秒。

图7查询结果 现在我们把表中的索引删除,重新执行查询计划,这时我们可以发现Logical Operation已经变为Table Scan,由于表中有万行数据,这时查询速度就相当缓慢。

图8查询计划 从下图查询结果,我们发现查询步骤变成3步了,首先通过Table Scan查找animal = ‘Ifcey',在执行查询的时候,SQL Server会自动分析SQL语句,而且它估计我们这次查询比较耗时,所以数据库进行并发操作加快查询的速度。 查询执行时间:CPU 时间= 毫秒,占用时间= 毫秒。

图9查询结果 通过上面的有聚集索引和没有的对比,我们发现了查询性能的差异,如果使用索引数据库首先查找索引,而不是漫无目的的全表遍历。 非聚集索引 在没有聚集索引的情况下,表中的数据页是通过堆(Heap)形式进行存储,堆是不含聚集索引的表;SQL Server中的堆存储是把新的数据行存储到最后一个页中。 非聚集索引是物理存储不按照索引排序,非聚集索引的叶节点(Index leaf pages)包含着指向具体数据行的指针或聚集索引,数据页之间没有连接是相对独立的页。 假设我们有一个表T_Pet,它包含四个字段分别是:animal,name,sex和age,而且使用animal作为非索引列,具体SQL代码如下: 图非聚集索引 接着我们要查询表中animal = ‘Cat'的宠物信息,具体的SQL代码如下: 如下图所示,我们发现查询计划的最右边有两个步骤:RID和索引查找。由于这两种查找方式相对于聚集索引查找要慢(Clustered Index Seek)。

图查询计划 首先SQL Server查找索引值,然后根据RID查找数据行,直到找到符合查询条件的结果。 查询执行时间:CPU 时间= 0 毫秒,占用时间= 1 毫秒

图查询结果 堆表非聚集索引 由于堆是不含聚集索引的表,所以非聚集索引的叶节点将包含指向具体数据行的指针。 以前面的T_Pet表为例,假设T_Pet使用animal列作为非聚集索引,那么它的堆表非聚集索引结构如下图所示:

图堆表非聚集索引 通过上图,我们发现非聚集索引通过双向链表连接,而且叶节点包含指向具体数据行的指针。 如果我们要查找animal = ‘Dog'的信息,首先我们遍历第一层索引,然后数据库判断Dog属于Cat范围的索引,接着遍历第二层索引,然后找到Dog索引获取其中的保存的指针信息,根据指针信息获取相应数据页中的数据,接下来我们将通过具体的例子说明。 现在我们创建表employees,然后给该表添加堆表非聚集索引,具体SQL代码如下: GO现在我们查找employee_id = 的员工信息。 查询计划如下图所示:

图查询计划 首先,查找索引值employee_id = ‘'的索引,然后根据RID查找符合条件的数据行;所以说,堆表索引的查询效率不如聚集表,接下来我们将介绍聚集表的非聚集索引。 聚集表非聚集索引 当表上存在聚集索引时,任何非聚集索引的叶节点不再是包含指针值,而是包含聚集索引的索引值。 以前面的T_Pet表为例,假设T_Pet使用animal列作为非聚集索引,那么它的索引表非聚集索引结构如下图所示:

图索引表非聚集索引 通过上图,我们发现非聚集索引通过双向链表连接,而且叶节点包含索引表的索引值。 如果我们要查找animal = ‘Dog'的信息,首先我们遍历第一层索引,然后数据库判断Dog属于Cat范围的索引,接着遍历第二层索引,然后找到Dog索引获取其中的保存的索引值,然后根据索引值获取相应数据页中的数据。 接下来我们修改之前的employees表,首先我们删除之前的堆表非聚集索引,然后增加索引表的非聚集索引,具体SQL代码如下:

图查询计划 索引的有效性 SQL Server每执行一个查询,首先要检查该查询是否存在执行计划,如果没有,则要生成一个执行计划,那么什么是执行计划呢?简单来说,它能帮助SQL Server制定一个最优的查询计划。(关于查询计划请参考这里) 下面我们将通过具体的例子说明SQL Server中索引的使用,首先我们定义一个表testIndex,它包含三个字段testIndex,bitValue和filler,具体的SQL代码如下: 接着我们查询表中bitValue = 0的数据行,而且表中bitValue = 0的数据有行。 图查询计划 现在我们查询bitValue = 1的数据行。 SELECT *FROM testIndexWHERE bitValue = 1 图查询计划 现在我们注意到对同一个表不同数据查询,居然执行截然不同的查询计划,这究竟是什么原因导致的呢? 我们可以通过使用DBCC SHOW_STATISTICS查看到表中索引的详细使用情况,具体SQL代码如下: 图直方图 通过上面的直方图,我们知道SQL Server估计bitValue = 0数据行行有约行,而bitValue = 1估计约;SQL Server优化器根据数据量估算值,采取不同的执行计划,从而到达最优的查询性能,由于bitValue = 0数据量大,SQL Server只能提供扫描聚集索引获取相应数据行,而bitValue = 1实际数据行只有行,SQL Server首先通过键查找bitValue = 1的数据行,然后嵌套循环联接到聚集索引获得余下数据行。 总结 完整实例代码:

推荐整理分享sqlserver 索引的一些总结(sqlserver索引类型区别),希望有所帮助,仅作参考,欢迎阅读内容。

sqlserver 索引的一些总结(sqlserver索引类型区别)

文章相关热门搜索词:sqlserver索引的作用,sqlserver索引语句,sqlserver索引的优缺点,sqlserver索引的作用,sqlserver索引的建立,sqlserver索引的分类,sqlserver索引的作用,sqlserver索引的建立,内容如对您有帮助,希望把文章链接给更多的朋友!

SQL Join的一些总结(实例) 1.1.1摘要Join是关系型数据库系统的重要操作之一,SQLServer中包含的常用Join:内联接、外联接和交叉联接等。如果我们想在两个或以上的表获取其中从一

SQL Transcation的一些总结分享 1.1.1摘要相信大家对于SQLTranscation再熟悉不过,它确保了数据库的数据一致性和安全性,尤其在对数据执行增删时,如果发生异常和错误它就会触发事务

SQL的Join使用图解教程 对于SQL的Join,在学习起来可能是比较乱的。我们知道,SQL的Join语法有很多inner的,有outer的,有left的,有时候,对于Select出来的结果集是什么样子有点

标签: sqlserver索引类型区别

本文链接地址:https://www.jiuchutong.com/biancheng/348163.html 转载请保留说明!

上一篇:SQL Server数据库入门学习总结(sql server数据库怎么导出)

下一篇:SQL Join的一些总结(实例)(sql中的join)

  • 应交税费借方余额0.01怎么调整
  • 印花税计税依据含不含增值税
  • 小规模免征增值税会计处理
  • 坏账准备需要计提成本吗
  • 发票勾选是否为转内销凭证是什么意思
  • 缴纳契约计税依据包含增值税吗
  • 享受专项附加扣除该怎么申报
  • 外币借款汇兑差额计入什么科目
  • 企业为员工租房账务处理
  • 销售免税药品要进项税额转出吗
  • 哪些收据可以税务登记
  • 公司名下没有车可以开运输发票吗
  • 生育津贴报销流程是怎么样的要去社保局问吗
  • 住宿专票怎么入账
  • 电子承兑汇票怎么打印出来
  • 购销行为是什么
  • 金税盘开票信息修改
  • 水产类账目怎么做
  • 外汇汇兑损益怎么做账
  • 跨年付上年租金帐务处理?
  • linux命令-a
  • 文件改后缀什么意思
  • 失控发票的企业如何处理
  • 最早的拍照手机是哪一年
  • 埃热泽尔斯湖面上的波纹,拉脱维亚拉特加尔地区 (© Eaglewood Films/Nimia)
  • 成本法的优点是计算较为简便,缺点是
  • 支付赊购材料款怎么入账
  • 个人税收是怎么计算的举例
  • 职工取得全年一次性奖金如何计算缴纳个人所得税?
  • conda配置虚拟环境
  • 损失函数是什么
  • 线性回归csdn
  • phpcms怎么用
  • 不良品扣款范本
  • 施工企业的人工费占比
  • 结转结余的概念
  • 只有进项发票,没有销项可以吗
  • 首涂24套
  • 织梦cms怎么样
  • 费用科目分别有什么
  • vue整合electron
  • 如何做固定资产的台账
  • 其他权益工具投资
  • 劳务是什么单位
  • 印花税申报怎么更正采集处理
  • 什么情况下需要做心脏造影
  • 保税仓发货的商品退货要承担税吗
  • 未确认融资费用借贷方向
  • 小规模纳税人去银行开立什么账户
  • 活动费用在哪个科目
  • 建筑施工企业会计第三版单旭课后题答案
  • 营业利润率高好还是低好
  • 滞纳金的上限是多少
  • 付给外包公司的垃圾处理费会计分录
  • 没有认证的进项税额怎么做凭证
  • 营业外支出会导致所有者权益减少吗
  • 资产类科目一般是什么
  • 财务票子怎么粘
  • 固定资产是指什么
  • mysql数据库操作题
  • win8系统怎样
  • 删除windows用户密码
  • win8 net framework
  • win edge
  • linux find . -name命令
  • 如何快速查询身份证号码
  • win 8.1激活
  • win7更改电脑设置在哪里
  • win7玩csgo掉帧怎么办
  • opengl 画线
  • 猫的所有视频
  • js获取浏览器类型和版本信息
  • shell去重计数
  • 简述shell命令提示符的组成
  • javascript教程推荐知乎
  • Android之SQLite
  • python函数参数的传递方法
  • 税务局税收风险排查总结
  • 重庆国家税务局发票流向查询
  • 7月税务征收期
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设