位置: 编程技术 - 正文
推荐整理分享在MySQL中使用Sphinx实现多线程搜索的方法(在mysql中使用视图的限制),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:在mysql中使用关键字什么定义新的语句结束符,在mysql中使用describe查看表字段信息的语法格式,在mysql中使用视图的限制,在mysql中使用索引不能避免进行全表的扫描,在mysql中使用视图的限制,在mysql中使用什么语句来查看数据表的结构,在mysql中使用什么语句来查看数据表的结构,在mysql中使用什么语句来查看数据表的结构,内容如对您有帮助,希望把文章链接给更多的朋友!
MySQL、Sphinx及许多数据库和搜索引擎中的查询是单线程的。比如说,在一台个CPU核心、个磁盘的R服务器上执行一个查询,它最多只会用到一个核心和一个磁盘。没错,只会使用一个。
如果查询是CPU密集型作业,那么会使用大约3%的整机CPU能力(以上述核机器为例)。如果是磁盘密集型,则大约会使用6%的整机IO能力(也是与上例同样的配置,个磁盘组成RAID或RAID0)。
我再换个说法吧。如果你在一台单核单磁盘的机器上执行了某个查询,花了秒,那么把同样的查询放到一台核磁盘的机器上去跑,同样需要秒,不会有丝毫改善。
你早就知道这一点了,对吧?那么,我的问题是——有没有办法可以改善呢?
如果是Sphinx,太棒了,答案是有!而且不需要花上太多的工夫。你甚至不需要修改应用和数据库,只需要稍微改下Sphinx的配置。
计划
首先,我来说明一下我们的目标。
Sphinx本身就支持分布式搜索,在很久以前就已经朝着水平扩展的目标来设计。如果索引在一台机器上放不下,可以让多台机器分别对不同的部分进行索引,设置一个聚合节点,负责从应用接收请求,然后把请求再同时发给所有的数据节点,最后将它们返回的结果合并起来,返回给应用。在应用看起来,就好像只有一台服务器在为它服务。
好,下面你猜怎么着?哈,我们可以把这个功能应用到单台机器上,让我们的查询快上n多倍。而且,现在Sphinx已经支持这种做法了,所以我们根本不用再假装查询哪些远程节点。
还有另外一个好处,配置分布式搜索以后,索引是可以并行建的!
还是有一点需要注意,虽然这种做法可以加速绝大多数的查询,但还是有一些例外的情况。因为,并行的查询结果仍然需要合并起来,而这个合并过程是单线程的。而且,合并包括一些CPU密集的操作,如分级、排序,甚至用GROUP BY进行COUNT,如果数据量很大,合并过程就会变成瓶颈。
要确认这一点也很简单,只要查看Sphinx的查询日志,看看每个查询匹配的记录数有多少,我们就心里有数了。
执行
假设在服务器上一个索引配置如下 (很多细节都省略了): 现在我们使用有3个CPU核心和磁盘的机器来做这个索引--就是这个idx1.下面是我们更改的配置文件 :
做完这些后,你需要重建索引. 但是现在idx1p0到idx1p2的索引indexer命令可以同步进行.
另外,用不同的操作来分离数据不是最好的办法, 你可以在MYSQL中用一个辅助表来区分它们的范围, 配合 sql_query_range使用或是别的什么, 具体根据你的数据来决定.
写在最后
我一直都很喜欢 Sphinx,Sphinx可以如此容易的扩展到你所需要的足够多的机器上,并且这种方式在很多年前就已经在被使用了。然后,我想,我并没有和我往常一样,利用这个特性来使得在一台机器上的查询变得更快。嗯,这并不是在说它很慢或者其实什么,只是,查询永远不会太快,不是吗?
Win7、WinXP下MySql安装出错完全卸载的方法步骤 最近mysql安装出现问题:1.操作系统不同,安装过程中删除,清理也不同:window7:安装mysql过程中,最后安装到startservice的时候提示服务有问题,然后卸
MySQL中给自定义的字段查询结果添加排名的方法 我正在用MySQL客户端的时候,突然想到如果可以给查询结果添加排名该多好啊,然后就找到了一个简单的解决办法。下面是一个示例表的数据:然后我们
MySQL中三种关联查询方式的简单比较 看看下面三个关联查询的SQL语句有何区别?SELECT*FROMfilmJOINfilm_actorON(film.film_id=film_actor.film_id)SELECT*FROMfilmJOINfilm_actorUSING(film_id)SELECT*FROMfilm,film_actorWHEREfilm.
标签: 在mysql中使用视图的限制
本文链接地址:https://www.jiuchutong.com/biancheng/347649.html 转载请保留说明!友情链接: 武汉网站建设