本文只是一个山寨试验品,思路仅供参考. --------------------------------------------------------------------------------原理介绍:索引建立 目录结构划分方案也只是很简易的实现了一下,通过unicode把任意连续的两个字符(中文或英文)分为4个字节来做四层目录,把索引的内容对应的主关键字(主要为了使用sql索引和唯一性)作为文件名,两个字符在索引内容中的位置作为文件后缀来存储.文件本身为0字节,不保存任何信息.比如一条数据 "pk","山寨索引" 山寨索引 四个字的unicode为[0]: [1]: [2]: [3]: [4]: [5]: [6]: [7]: 那么对应的文件结构为../////pk .0../////pk .1../////pk .2索引使用 比如搜索"寨索引 " 则搜索 "../////" 目录下的所有文件,然后根据 pk .1的文件后缀名1,去看 ../////pk.2文件是否存在.依次类推,最后返回一个结果集. --------------------------------------------------------------------------------实用性具体的实用性还有待验证.这只是实现了精确的like搜索,而不能做常见搜索引擎的分词效果.另外海量数据重建索引的性能也是面临很严峻的问题,比如cpu负载和磁盘io负载.关于windows一个目录下可以保持多少个文件而不会对文件搜索造成大的性能损失也有待评估,不过这个可以考虑根据主键的文件名hash来增加文件目录深度降低单一目录下的文件数量.--------------------------------------------------------------------------------演示效果实现了针对test标的name和caption两个字段作索引搜索. -- 设置和获取索引文件根目录 --select dbo.xfn_SetMyIndexFileRoot('d:/MyIndex') --select dbo.xfn_GetMyIndexFileRoot() -- 建立测试环境 go create table test( id uniqueidentifier , name nvarchar ( ), caption nvarchar ( )) insert into test select top 3 newid (), ' 我的索引 ' , ' 测试 ' from sysobjects insert into test select top 3 newid (), ' 我的测试 ' , ' 索引 ' from sysobjects insert into test select top 3 newid (), ' 测试索引 ' , ' 测试索引 ' from sysobjects insert into test select top 3 newid (), ' 我的索引 ' , ' 索引 ' from sysobjects create index i_testid on test( id) -- 建立索引文件 declare @t int select @t= dbo. xfn_SetKeyForMyIndex( id, 'testIndex' , name + ' ' + caption) from test -- 查询数据 select a.* from test a, dbo. xfn_GetKeyFromMyIndex( '测试 索引 我的' , 'testIndex' ) b where a. id= b. pk/* 0CEA-DF-A-A8E5-BD5FEED 我的索引 测试 2DDB-CD3F-4F-BB4A-F 我的索引 测试 8CA6C3-F-C-BA-CEAE3E 我的索引 测试 CBF1-FB1F-FB-8A-ECEAD3E5 我的测试 索引 8BBFCC-9DBB-4FCB-B2EB-DEDD5F 我的测试 索引 8BD-8E--A-CDF1FA0A 我的测试 索引 */ --drop table test --------------------------------------------------------------------------------clr代码如下:编译为MyFullIndex.dll--------------------------------------------------------------------------------部署的sql脚本如下--drop function dbo.xfn_SetMyIndexFileRoot --drop function dbo.xfn_GetMyIndexFileRoot --drop function dbo.xfn_GetKeyFromMyIndex --drop function dbo.xfn_SetKeyForMyIndex --drop assembly MyFullIndex --go CREATE ASSEMBLY MyFullIndex FROM 'd:/SQLCLR/MyFullIndex.dll' WITH PERMISSION_SET = UnSAFE; -- go -- 索引搜索 CREATE FUNCTION dbo. xfn_GetKeyFromMyIndex ( @word nvarchar ( max ), @indexName nvarchar ( )) RETURNS table ( pk nvarchar ( )) AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. GetIndex go -- 索引建立 CREATE FUNCTION dbo. xfn_SetKeyForMyIndex ( @pk nvarchar ( ), @indexName nvarchar ( ), @word nvarchar ( max )) RETURNS int AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. SetIndex go -- 获取索引文件根目录 CREATE FUNCTION dbo. xfn_GetMyIndexFileRoot () RETURNS nvarchar ( max ) AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. GetRoot go -- 设置索引文件根目录(默认目录为 d:/myindex ) CREATE FUNCTION dbo. xfn_SetMyIndexFileRoot ( @FileRoot nvarchar ( max )) RETURNS bit AS EXTERNAL NAME MyFullIndex. UserDefinedFunctions. SetRoot go
推荐整理分享SQL2005CLR函数扩展 - 关于山寨索引(sqlldr 函数),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:sql函数coalesce,sql all函数,sql clr,sqlceiling函数的用法,sql clr,sql clr,sqlceil函数,sqlceil函数,内容如对您有帮助,希望把文章链接给更多的朋友!
SQLCLR函数扩展-繁简转换的实现代码 这个方法比较简单,用Microsoft.VisualBasic命名空间下强大的字符串处理函数就可以了c#代码如下,编译为BigConvertor.dll--------------------------------------------------
SQLCLR函数扩展-解析天气服务的实现 我们可以用CLR获取网络服务来显示到数据库自定函数的结果集中,比如的天气预报
SQLCLR函数扩展-数据导出的实现详解 SQLServer数据导出到excel有很多种方法,比如dts、ssis、还可以用sql语句调用openrowset。我们这里开拓思路,用CLR来生成Excel文件,并且会考虑一些方便操作