位置: 编程技术 - 正文

MYSQL 随机 抽取实现方法及效率分析(mysql 随机抽样)

编辑:rootadmin
但是,后来我查了一下MYSQL的官方手册,里面针对RAND()的提示大概意思就是,在ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描。但是在MYSQL 3.版本中,仍然可以通过ORDER BY RAND()来实现随机。 但是真正测试一下才发现这样效率非常低。一个万余条的库,查询5条数据,居然要8秒以上。查看官方手册,也说rand()放在ORDER BY 子句中会被执行多次,自然效率及很低。 You cannot use a column with RAND() values in an ORDER BY clause, because ORDER BY would evaluate the column multiple times. 搜索Google,网上基本上都是查询max(id) * rand()来随机获取数据。 SELECT * FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * (SELECT MAX(id) FROM `table`)) AS id) AS t2 WHERE t1.id >= t2.id ORDER BY t1.id ASC LIMIT 5; 但是这样会产生连续的5条记录。解决办法只能是每次查询一条,查询5次。即便如此也值得,因为万条的表,查询只需要0.秒不到。 下面的语句采用的是JOIN,mysql的论坛上有人使用 SELECT * FROM `table` WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` ) ORDER BY id LIMIT 1; 我测试了一下,需要0.5秒,速度也不错,但是跟上面的语句还是有很大差距。总觉有什么地方不正常。 于是我把语句改写了一下。 SELECT * FROM `table` WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `table`))) ORDER BY id LIMIT 1; 这下,效率又提高了,查询时间只有0.秒 最后,再把语句完善一下,加上MIN(id)的判断。我在最开始测试的时候,就是因为没有加上MIN(id)的判断,结果有一半的时间总是查询到表中的前面几行。 完整查询语句是: SELECT * FROM `table` WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`)) + (SELECT MIN(id) FROM `table`))) ORDER BY id LIMIT 1; SELECT * FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))+(SELECT MIN(id) FROM `table`)) AS id) AS t2 WHERE t1.id >= t2.id ORDER BY t1.id LIMIT 1; 最后在php中对这两个语句进行分别查询次, 前者花费时间 0. 秒 后者花费时间 0. 秒 看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。

推荐整理分享MYSQL 随机 抽取实现方法及效率分析(mysql 随机抽样),希望有所帮助,仅作参考,欢迎阅读内容。

MYSQL 随机 抽取实现方法及效率分析(mysql 随机抽样)

文章相关热门搜索词:mysql随机抽取数据,mysql 随机抽样,mysql随机抽取10条数据数据超过五十万,mysql随机抽取10%数据,mysql随机抽取某个范围内的日期,将其作为开心日,mysql随机抽取数据用什么命令,mysql随机抽取10%数据,mysql随机抽取数据50条,内容如对您有帮助,希望把文章链接给更多的朋友!

mysql 存储过程的问题 一开始用phpMyAdmin来执行,后来出现一堆错误,后来去掉了begin,end之后可以正常执行,但要执行存储过程,在phpMyAdmn中不行,而在mysql命令行文本框中就

Mysql my.ini 配置文件详解 Mysqlmy.ini配置文件详解#BEGINCONFIGINFO#DESCR:4GBRAM,只使用InnoDB,ACID,少量的连接,队列负载大#TYPE:SYSTEM#ENDCONFIGINFO##此mysql配置文件例子针对4G内存#主要使用INNODB#

java实现插入mysql二进制文件,blob类型,遇到问题及解决办法 首先是数据库建立要准备的:我们要把放置二进制字段设置为Blob类型,根据文件的大小选择合适的Blob类型,一下是各个Blob类型所能容纳二进制文件的

标签: mysql 随机抽样

本文链接地址:https://www.jiuchutong.com/biancheng/320195.html 转载请保留说明!

上一篇:MySQL 配置文件my.cnf 例子最详细翻译(mysql配置文件my.ini如何配置)

下一篇:mysql 存储过程的问题(mysql8.0存储过程)

  • 应交税费待抵扣进项税额
  • 汇算清缴时纳税调整表调增金额是怎么算出来的
  • 国家重大水利工程建设基金计算方法
  • 将自产货物赠送客户
  • 预缴增值税后隔多久缴纳
  • 税金及附加主要分析
  • 交通费怎么抵扣进项税
  • 非税收入票据能报销吗
  • 退货折价的账务处理分录
  • 进口奶牛缴纳增值税
  • 企业会计一般做什么
  • 增值税计算方式举例
  • 未开票收入已报税怎么办
  • 单位社保没推送
  • 进项发票税点属于什么科目?
  • 负债表应交税费为负数
  • 普通发票电子发票没有章
  • 财产税放在哪个科目
  • 地税附加税减免政策
  • 适用差额征税的小规模纳税人有哪些
  • 外籍人员来华工作
  • 金税盘怎么增加复核人
  • 代付租金委托书怎么写
  • 出口的货物因质量问题被扣款
  • 行政事业性收费包括哪些项目
  • 职工食堂操作流程图
  • KunlunPlatform.exe是什么进程?KunlunPlatform.exe是安全的程序吗?
  • 办理不动产证需要什么手续及证件
  • “Property or method “***“ is not defined on the instance but referenced during render.”报错的原因及解决方案
  • 截取字符串php
  • 配置多数据源的好处
  • 销售费用可以开专票吗
  • nvme安装win10教程
  • cnn数据集
  • 固定资产处置金额是什么意思
  • 自动结转制造费用生成不了凭证怎么办
  • 资产负债表投资性房地产怎么填
  • 博客首页设计
  • 残保金由哪个部门负责稽查
  • 汽车的计提折旧
  • 印花税计税金额是主营业务收入吗
  • 零申报失败什么原因
  • 即征即退 条件
  • db2数据库安装服务器的环境
  • 内账中采购另付的税点算成本还是费用
  • 开票内容不在经营范围内
  • 普通发票税费会计分录
  • 劳务外经证预缴税款
  • 广告设计合同属于什么合同
  • 摘要界面在哪个位置
  • 其他业务支出的借贷方向
  • 收到水电费发票要交印花税吗
  • 固定资产的维修计入什么科目
  • 公司卖掉软件计入成本吗
  • 会计怎么做的
  • 现金和银行存款的区别
  • prometheus operator
  • 让Vista响应更快
  • centos6.5中文
  • centos叫什么
  • 黑苹果驱动说明
  • 挂载光驱的命令
  • 取消windows 7的自动关机如何设置
  • mac系统文件名
  • windows7 excel
  • ghoststarttrayapp.exe是什么进程 有什么作用 ghoststarttrayapp进程查询
  • win8软件不兼容怎么办
  • win7开机后一段时间卡死
  • win8.1system磁盘占用率高
  • 铁嘴银牙剧情简介
  • 查cpu内存命令
  • js的定时器函数
  • [置顶]马粥街残酷史
  • unity 角色
  • javascript要怎么学
  • unity toggle切换状态
  • jquery操作元素样式
  • 广东省国家税务局电子税务局官网
  • 煤炭限产是利好还是利空
  • 广西地税代收工作怎么样
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设