位置: 编程技术 - 正文

数据库中聚簇索引与非聚簇索引的区别[图文](数据库聚簇索引和非聚簇索引)

编辑:rootadmin

在《数据库原理》里面,对聚簇索引的解释是:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚簇索引。

不过这个定义太抽象了。在SQL Server中,索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。如下图:

推荐整理分享数据库中聚簇索引与非聚簇索引的区别[图文](数据库聚簇索引和非聚簇索引),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据库聚簇索引语句,数据库聚簇索引语句,数据库中聚簇索引,数据库聚簇索引,数据库聚簇索引怎么建立,数据库中聚簇索引,数据库中聚簇索引,数据库中聚簇索引的概念,内容如对您有帮助,希望把文章链接给更多的朋友!

数据库中聚簇索引与非聚簇索引的区别[图文](数据库聚簇索引和非聚簇索引)

非聚簇索引

聚簇索引

聚簇索引与非聚簇索引的本质区别到底是什么?什么时候用聚簇索引,什么时候用非聚簇索引?

这是一个很复杂的问题,很难用三言两语说清楚。我在这里从SQL Server索引优化查询的角度简单谈谈(如果对这方面感兴趣的话,可以读一读微软出版的《Microsoft SQL Server 数据库编程》第3单元的数据结构引论以及第6、、单元)。

一、索引块与数据块的区别

大家都知道,索引可以提高检索效率,因为它的二叉树结构以及占用空间小,所以访问速度块。让我们来算一道数学题:如果表中的一条记录在磁盘上占用 字节的话,我们对其中字节的一个字段建立索引,那么该记录对应的索引块的大小只有字节。我们知道,SQL Server的最小空间分配单元是“页(Page)”,一个页在磁盘上占用8K空间,那么这一个页可以存储上述记录8条,但可以存储索引条。现在我 们要从一个有条记录的表中检索符合某个条件的记录,如果没有索引的话,我们可能需要遍历条×字节/8K字节=个页面才能 够找到结果。如果在检索字段上有上述索引的话,那么我们可以在条×字节/8K字节=个页面中就检索到满足条件的索引块,然后根据索引块上 的指针逐一找到结果数据块,这样IO访问量要少的多。

二、索引优化技术

是不是有索引就一定检索的快呢?答案是否。有些时候用索引还不如不用索引快。比如说我们要检索上述表中的所有记录,如果不用索引,需要访问 条×字节/8K字节=个页面,如果使用索引的话,首先检索索引,访问条×字节/8K字节=个页面得到索引检索结果,再根 据索引检索结果去对应数据页面,由于是检索所有数据,所以需要再访问条×字节/8K字节=个页面将全部数据读取出来,一共访问了 个页面,这显然不如不用索引快。

SQL Server内部有一套完整的数据检索优化技术,在上述情况下,SQL Server的查询计划(Search Plan)会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQL Server是怎么知道什么时候用索引,什么时候不用索引的呢?SQL Server除了日常维护数据信息外,还维护着数据统计信息,下图是数据库属性页面的一个截图:

从图中我们可以看到,SQL Server自动维护统计信息,这些统计信息包括数据密度信息以及数据分布信息,这些信息帮助SQL Server决定如何制定查询计划以及查询是是否使用索引以及使用什么样的索引(这里就不再解释它们到底如何帮助SQL Server建立查询计划的了)。我们还是来做个实验。建立一张表:tabTest(ID, unqValue,intValue),其中ID是整形自动编号主索引,unqValue是uniqueidentifier类型,在上面建立普通索 引,intValue 是整形,不建立索引。之所以挂上一个没有索引的intValue字段,就是防止SQL Server使用索引覆盖查询优化技术,这样实验就起不到作用了。向表中录入条随机记录,代码如下:

CREATE TABLE [dbo].[tabTest] ( [ID] [int] IDENTITY (1, 1) NOT NULL , [unqValue] [uniqueidentifier] NOT NULL , [intValue] [int] NOT NULL ) ON [PRIMARY]GOALTER TABLE [dbo].[tabTest] WITH NOCHECK ADD CONSTRAINT [PK_tabTest] PRIMARY KEY CLUSTERED ( [ID] ) ON [PRIMARY] GOALTER TABLE [dbo].[tabTest] ADD CONSTRAINT [DF_tabTest_unqValue] DEFAULT (newid()) FOR [unqValue]GOCREATE INDEX [IX_tabTest_unqValue] ON [dbo].[tabTest]([unqValue]) ON[PRIMARY]GOdeclare @i intdeclare @v intset @i=0while @i<begin set @v=rand()* insert into tabTest ([intValue]) values (@v) set @i=@i+1end然后我们执行两个查询并查看执行计划,如图:(在查询分析器的查询菜单中可以打开查询计划,同时图上第一个查询的GUID是我从数据库中找的,大家做实验的时候可以根据自己数据库中的值来定):

从图中可以看出,在第一个查询中,SQL Server使用了IX_tabTest_unqValue索引,根据箭头方向,计算机先在索引范围内找,找到后,使用Bookmark Lookup将索引节点映射到数据节点上,最后给出SELECT结果。在第二个查询中,系统直接遍历表给出结果,不过它使用了聚簇索引,为什么呢?不要忘 了,聚簇索引的页节点就是数据节点!这样使用聚簇索引会更快一些(不受数据删除、更新留下的存储空洞的影响,直接遍历数据是要跳过这些空洞的)。

下面,我们在SQL Server中将ID字段的聚簇索引更改为非聚簇索引,然后再执行select * from tabTest,这回我们看到的执行计划变成了:

SQL Server没有使用任何索引,而是直接执行了Table Scan,因为只有这样,检索效率才是最高的。

三、聚簇索引与非聚簇索引的本质区别

现在可以讨论聚簇索引与非聚簇索引的本质区别了。正如本文最前面的两个图所示,聚簇索引的叶节点就是数据节点,而非聚簇索引的页节点仍然是索引检点,并保留一个链接指向对应数据块。

还是通过一道数学题来看看它们的区别吧:假设有一条记录的表,表中每条记录在磁盘上占用字节,如果在一个字节长的字段上建立非 聚簇索引主键,需要二叉树节点个(这个节点中有个叶节点,每个页节点都指向一个数据记录),这样数据将占用条 ×字节/8K字节=个页面;索引将占用个节点×字节/8K字节=个页面,共计个页面。

同样一张表,如果我们在对应字段上建立聚簇索引主键,由于聚簇索引的页节点就是数据节点,所以索引节点仅有个,占用个页面,数据仍然占有个页面。

下面我们看看在执行插入操作时,非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复,那么SQL Server是怎么知道不出现重复的呢?唯一的方法就是检索。对于非聚簇索引,只需要检索个页面中的个节点就知道是否有重复,因为所有主键 键值在这个索引节点中都包含了。但对于聚簇索引,索引节点仅仅包含了个中间节点,至于会不会出现重复必须检索另外个页数据节点 才知道,那么相当于检索+=个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

让我们再来看看数据检索的效率,如果对上述两表进行检索,在使用索引的情况下(有些时候SQL Server执行计划会选择不使用索引,不过我们这里姑且假设一定使用索引),对于聚簇索引检索,我们可能会访问个索引页面外加个数据页面得 到结果(实际情况要比这个好),而对于非聚簇索引,系统会从个页面中找到符合条件的节点,再映射到个数据页面上(这也是最糟糕的情况),比较 一下,一个访问了个页面而另一个访问了个页面,可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好,都适合排序,聚簇 索引仅仅比非聚簇索引快一点。

结语

好了,写了半天,手都累了。关于聚簇索引与非聚簇索引效率问题的实验就不做了,感兴趣的话可以自己使用查询分析器对查询计划进行分析。SQL Server是一个很复杂的系统,尤其是索引以及查询优化技术,Oracle就更复杂了。了解索引以及查询背后的事情不是什么坏事,它可以帮助我们更为深 刻的了解我们的系统。

SQL SERVER 与ACCESS、EXCEL的数据转换方法分享 在Transact-SQL语句中,我们主要使用OpenDataSource函数、OPENROWSET函数,关于函数的详细说明,请参考SQL联机帮助。利用下述方法,可以十分容易地实现SQLSERVE

sqlserver 中创建用户的图文方法 一旦被黑客获取到webshell,黑客就知道了你的sqlserver管理员密码,如果sqlserver再没有经过安全设置那么黑客很容易就提权并新建系统管理员账号,那么

SQLServer 跨库查询实现方法 本文给出一条SQL语句用于展示在同一名服务器上,不同的数据库间查询,注意当前连接用户要对两个库都有权限SQLServer中SQL语句中对象的完整表达式是

标签: 数据库聚簇索引和非聚簇索引

本文链接地址:https://www.jiuchutong.com/biancheng/348521.html 转载请保留说明!

上一篇:SQLServer 2000 升级到 SQLServer 2008 性能之需要注意的地方之一(sqlserver升级到2016)

下一篇:SQL SERVER 与ACCESS、EXCEL的数据转换方法分享(sql server ceiling)

  • 企业在异地设立的办事处撤销了,人员咋办
  • 允许抵扣的进项税额分为哪几种情况
  • 快递费运费物流费一样吗
  • 暂估入库年末怎么处理
  • 计提工资和实际发放工资必须一致吗
  • 税务未抄报
  • 纳税申报方式如何更改
  • 结存材料物资会计分录怎么做?
  • 劳务公司的暂估费是什么
  • 以前没有计提增值税吗
  • 房地产商品房销售营业税怎么算
  • 公司为什么要员工提供房产证
  • 劳务公司差额开票的方式有哪些
  • 税务局每年都会大数据抽查吗
  • 甲供材料工程如何办理结算
  • 土地转让增值税计税依据
  • 当进项大于销项需要做账务处理吗?
  • 个体户需要申报工资薪金吗
  • 出租设备计提折旧记什么科目
  • 建筑投资包括哪些
  • 企业所得税税率表2023年最新
  • 1697509557
  • 产品的销售收入减去全部生产成本叫
  • 用自产的产品用于生产线
  • 没有权限使用网络资源,请与这台服务器的管理员联系
  • 电脑中毒之后怎么办
  • 完税凭证遗失后怎么处理
  • 广告行业物料
  • 子公司使用母公司授信
  • 退货时会计分录的银行存款能是负数吗
  • 购入增值税税控系统专用设备
  • 图像相似性度量
  • 收取的延期付款利息会计调账处理
  • php图片识别处理归类
  • 其它收益和递延收益
  • ChatGPT全面升级,GPT4支持多模态数据。
  • python自动控制
  • md5 linux
  • 什么情况下可以转入资本公积
  • 企业所得税报表模板
  • 个税app重置申报
  • 勾选平台发票下载
  • sqlserver使用awe分配内存
  • 织梦艺嫣跳舞
  • 印花税的缴纳
  • 个人所得税税率怎么算
  • PostgreSQL教程(四):数据类型详解
  • 无形资产租金计入什么科目
  • 增值税一般纳税人是什么意思
  • 医院销售药品是否缴纳增值税
  • 查缴个人海外避税所得税
  • 水利建设行业
  • 进项税可以跨年结转吗
  • 公司发放节日礼品
  • 公司支付给实习生的报酬如何税前扣除?
  • 其他业务收入在利润表中怎么填写
  • 2020公司年会奖品清单
  • MySQL 5.5.x my.cnf参数配置优化详解
  • mysql 5.7.12 winx64手动安装教程
  • win7怎么设置桌面位置
  • windows service 2003
  • 忘记mysql密码
  • centos哪个版本最好用2022
  • window10的微软商店在哪
  • 如何检测装有监控器?
  • window10自带录屏录制不工作
  • win10一年更新一次
  • js动态表单
  • python selenium原理
  • javascript中的getElementById
  • android反编译apk
  • JS Timing
  • jquery ajax局部加载方法详解(实现代码)
  • 国税局发票查验平台查询不到
  • 税务所是县级机构吗
  • 开发区税务局咨询电话
  • uk开票软件如何赋码
  • 税务如何查饭店信息
  • 奔驰购置税多少钱
  • 印刷行业费用标准
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设