位置: 编程技术 - 正文
推荐整理分享探讨select in 在postgresql的效率问题(select
文章相关热门搜索词:select into in,select into statement,select into select,select
在知乎上看到这样一个问题:
MySQL 查询 select * from table where id in (几百或几千个 id) 如何提高效率?修改
电商网站,一个商品属性表,几十万条记录,M,索引只有主键id,做这样的查询如何提高效率?
select * from table where id in (几百或几千个id)
这些id没啥规律,分散的。。。。
看了一下答案,感觉有好多不靠谱的,但是口说无凭,所以在我的电脑上写了几个查询测试一下。我用的是Postgresql9.4,但感觉mysql应该也差不多,首先创建一个简单表,只有简单的3列,在这个问题的下面好多人提到了需要看表的大小,其实这个问题和表大小无关,只和index的大小有关,因为是index是建立在int上的,所以只和纪录数目有关。
之后生成一些随机数,Mac上用jot,Linux上用shuf
然后根据rand.file 生成查询语句:
分别生成3个sql文件,in内变量的数目分别是,和个,执行这3个sql文件,看看时间
可以看到只有在in内数据到了,个的时候数据时间会有比较大的变化,但也不过是在多ms内完成。
那如果按照有些回答那样,先建一个临时表,然后用in subquery,并且希望这时候可以两表join呢?为了简单我直接用两表join了
时间如何呢?
除去drop和create的时间,依然花费了+的时间,这里的前提还是我用的ssd盘,所以写LOG的时间会快很多。为什么会这么慢呢?用explain看一下,这时候数据量较大,直接走Merge join 了
那行数据的效率如何呢?
行的数据如下:
可以看到在个值和个值的情况下create table的方式不会比直接在in里面写所有的变量好多少,explain看的话是在用NLJ了。但在数据量更大(按照原问题,这里in的数量其实无法预知)的情况下效率只会更低,再加上额外的表维护成本和多余的SQL语句,DBA肯定不喜欢的,还是相信数据库,放心大胆直接用in list来搞定这些问题吧。
以上内容是针对select in 在postgresql的效率问题,希望对大家有所帮助!
SQL Server 身份验证(Authentication) 在保密你的服务器和数据,防备当前复杂的攻击,SQLServer有你需要的一切。但在你能有效使用这些安全功能前,你需要理解你面对的威胁和一些基本的
SQL性能优化之定位网络性能问题的方法(DEMO) 最近项目组同事跟我说遇到一个SQL性能问题,他说全表只有条记录,客户端执行耗费了两分多钟,很不科学。我帮了分析出了原因并得到解决。下面小
SQL Server 里的sys.dm_exec_input_buffer的问题 我们都知道DBCC命令有点尴尬,因为你不能在T-SQL查询里调用它们,你也不能关联它们的输出到其它DMV/DMF。例如你想为每个用户会话返回最后一个执行的S
标签: select
友情链接: 武汉网站建设